Olfeo OEM URL DB

Catégorisez avec précision et finesse les URLs et domaines

Pour les éditeurs de logiciel

La catégorisation d’un grand volume d’URLs représente un défi complexe

  • Hétérogénéité et ambiguïté du contenu

    Les sites web peuvent couvrir une vaste gamme de sujets, souvent avec des contenus qui se chevauchent entre différentes catégories. Trouver une manière de classer ces URLs de façon à ce que les catégories soient à la fois précises et utiles pour l’utilisateur final peut être difficile.

  • Évolution rapide d’internet

    Les sites web évoluent constamment, avec de nouveaux contenus ajoutés, des sites qui disparaissent, et des changements dans la pertinence des sujets. Maintenir une base de données d’URLs à jour et correctement catégorisée face à cette dynamique est une tâche exigeante.

  • Volume massif de données

    Avec des milliards de sites web actifs, le simple volume de données à traiter peut être écrasant. Cela nécessite des solutions automatisées, comme l’apprentissage automatique, qui doivent être formées, testées et constamment affinées.

  • Prise en compte de l’expérience utilisateur

    Il est crucial que les systèmes de catégorisation soient conçus avec l’utilisateur final en tête, ce qui signifie qu’ils doivent être intuitifs, faciles à naviguer, et pertinents pour les besoins de recherche des utilisateurs.

NOTRE SOLUTION

Olfeo OEM propose la base de données d’URL la plus fiable du marché

Olfeo propose sa base de données d’URLs et domaines en marque blanche aux éditeurs de logiciels qui souhaitent enrichir les fonctionnalités de leur produit.
Grâce à la fiabilité, la finesse de sa catégorisation et son exhaustivité couvrant 99%+ des requêtes, Olfeo OEM permet d’apporter plus de précision, de contexte et de valeur à la donnée recueillie par ses clients.

La base données d’ULRs pour votre solution logicielle
  • + 100

    Catégories répartis en 9 thèmes

  • 25 millions

    de domaines classés, correspondant à des centaines de millions d’URLs

  • 99%

    de taux de reconnaissance des requêtes

     

Nos atouts

La classification la plus fiable du marché grâce à notre base de domaines et URLs catégorisées

Exhaustivité de la base de données
Fiabilité de la catégorisation
Intégration facilitée
Mise à jour continue de la base
Exhaustivité de la base de données

Permettant de filtrer des centaines de millions d’URLs, la base d’URLs d’Olfeo est capable de couvrir efficacement le profil de navigation des utilisateurs. Avec un taux de reconnaissance unique supérieur à 99%, la vaste majorité des sites consulté, est reconnue et correctement catégorisé grâce à notre approche combinant préclassification automatique à base d’IA et validation par un opérateur humain.

Cette approche unique permet d’enrichir efficacement les services fournis par vos solutions logicielles.

Fiabilité de la catégorisation

Tous les contenus catégorisés dans notre base d’URLs sont soumis à une double analyse : automatique et humaine. L’analyse manuelle systématique de chaque contenu classé, réalisée par un expert Olfeo, est une garantie de qualité. Notre taux de fiabilité de classement est supérieur à 99%.

La vérification humaine systématique de chaque contenu est facilitée par l’utilisation d’outil de de pré-classement de grande qualité. Les algorithmes puissants d’intelligence artificielle qui vont analyser les pages web, interagissant avec nos bases de mots clefs enrichies par nos linguistes, permettent d’obtenir des résultats de pré-classement extrêmement qualitatif.

Cependant pour obtenir une finesse de classement inégalée, seule l’intervention humaine, encadrée par une méthodologie éprouvée et commune à l’équipe, permet d’atteindre un taux de reconnaissance des navigations, supérieur à 99 % et un taux de faux positif proche de 0.

Intégration facilitée

L’intégration des bases Olfeo ne nécessite pas d’installer un programme tiers. Vous gardez la maîtrise de l’échange des données avec vos clients. Vous êtes complètement autonome dans l’exploitation de nos bases Olfeo et leur intégration est extrêmement simple.

La base d’un poids de 2.5 Go s’intègre facilement sur n’importe quel alliance physique ou virtuelle. Sous la forme d’un fichier LMDB, la base est mise à jour de manière sécurisée et hebdomadaire pour garantir que les données restent à jour.

Mise à jour continue de la base

Pour assurer la qualité des données dans la base, un processus continu est en place:

1. La base de données s’enrichit continuellement par les remontées issues des navigations des utilisateurs des produits OLFEO, par des recherche de nouveaux domaines couvrant des thématiques ciblées mais aussi par la veille et l’exploitation de liste de domaines disponibles en sources ouvertes.

2. L’intégration d’un nouvel algorithme d’intelligence artificielle dans notre chaîne de pré-traitement automatique, en collaboration avec la DGA (Direction Générale de L’armement) nous offre une amélioration en continu et une précision améliorée lors de cette étape initiale de classification des domaines.

3. L’analyse humaine par nos équipes d’experts permet la confirmation de l’analyse automatique ou la correction le cas échéant.

4. Enfin, l’amélioration continue permet la veille sur les changements possibles de contenus et actualisation des catégories. Des nouvelles catégories sont également créées pour s’adapter aux évolutions d’usage d’internet. Par exemple, la catégorie IA Génératives a récemment été déployée pour répondre à la demande de nos clients qui avaient besoin de suivre la consommation de services liés à l’utilisation de IA génératives (ChatGPT etc.)

Les cas d’usage

Olfeo OEM permet de couvrir un large panel de cas d’usages

La qualité de notre base de données est reconnue par les éditeurs de logiciel
Ils nous font confiance
  • Evistel fournisseur leader de solutions pour Opérateurs a intégré la base de données d’URLs Quatily de la société Olfeo afin de proposer un service de contrôle parental aux Opérateurs Telecom. Le choix de la base Olfeo était une évidence pour nous en regard de sa fiabilité, du nombre de sites sensibles qu’elle contient, et représente un atout indispensable afin de protéger le jeune public de contenus non sollicités.

  • Ekinops leverages Olfeo technologies to differentiate its networking and SD-Wan solutions with advanced web security functions. Our solutions combined together uniquely identify and control applications over Internet.

  • We work closely with Olfeo to incorporate their SaaS application database in our Ipanema SD-WAN product. By using the Olfeo database we enable Ipanema SD-WAN to deliver best in class application intelligence in the SD-WAN
    market