Olfeo URL DB

Catégorisez avec précision et finesse les URLs et domaines

Contactez-nous pour tester la solution >
pour les éditeurs de logiciels
La catégorisation d’un grand volume d’URLs représente un défi complexe
Hétérogénéité et ambiguïté du contenu
Les sites web peuvent couvrir une vaste gamme de sujets, souvent avec des contenus qui se chevauchent entre différentes catégories. Trouver une manière de classer ces URLs de façon à ce que les catégories soient à la fois précises et utiles pour l’utilisateur final peut être difficile.
Évolution rapide d’internet
Les sites web évoluent constamment, avec de nouveaux contenus ajoutés, des sites qui disparaissent, et des changements dans la pertinence des sujets. Maintenir une base de données d’URLs à jour et correctement catégorisée face à cette dynamique est une tâche exigeante.
Volume massif de données
Avec des milliards de sites web actifs, le simple volume de données à traiter peut être écrasant. Cela nécessite des solutions automatisées, comme l’apprentissage automatique, qui doivent être formées, testées et constamment affinées.
Prise en compte de l’expérience utilisateur
Il est crucial que les systèmes de catégorisation soient conçus avec l’utilisateur final en tête, ce qui signifie qu’ils doivent être intuitifs, faciles à naviguer, et pertinents pour les besoins de recherche des utilisateurs.
NOTRE SOLUTION

Olfeo OEM propose la base de données d’URL la plus fiable du marché

Olfeo propose sa base de données d’URLs et domaines en marque blanche aux éditeurs de logiciels qui souhaitent enrichir les fonctionnalités de leur produit.
Grâce à la fiabilité, la finesse de sa catégorisation et son exhaustivité couvrant 99%+ des requêtes, Olfeo OEM permet d’apporter plus de précision, de contexte et de valeur à la donnée recueillie par ses clients.

Contactez-nous pour un essai gratuit
Contactez-nous pour un essai gratuit >
La base données d’ULRs pour votre solution logicielle
+100
Catégories répartis en 9 thèmes
25 millions
de domaines classés, correspondant à des centaines de millions d’URLs
99%
de taux de reconnaissance des requêtes
NOS ATOUTS

La classification la plus fiable du marché grâce à notre base de domaines et URLs catégorisées

Permettant de filtrer des centaines de millions d’URLs, la base d’URLs d’Olfeo est capable de couvrir efficacement le profil de navigation des utilisateurs. Avec un taux de reconnaissance unique supérieur à 99%, la vaste majorité des sites consulté, est reconnue et correctement catégorisé grâce à notre approche combinant préclassification automatique à base d’IA et validation par un opérateur humain.

Cette approche unique permet d’enrichir efficacement les services fournis par vos solutions logicielles.

Tous les contenus catégorisés dans notre base d’URLs sont soumis à une double analyse : automatique et humaine. L’analyse manuelle systématique de chaque contenu classé, réalisée par un expert Olfeo, est une garantie de qualité. Notre taux de fiabilité de classement est supérieur à 99%. 

 

La vérification humaine systématique de chaque contenu est facilitée par l’utilisation d’outil de de pré-classement de grande qualité. Les algorithmes puissants d’intelligence artificielle qui vont analyser les pages web, interagissant avec nos bases de mots clefs enrichies par nos linguistes, permettent d’obtenir des résultats de pré-classement extrêmement qualitatif.

Cependant pour obtenir une finesse de classement inégalée, seule l’intervention humaine, encadrée par une méthodologie éprouvée et commune à l’équipe, permet d’atteindre un taux de reconnaissance des navigations, supérieur à 99 % et un taux de faux positif proche de 0.

L’intégration des bases Olfeo ne nécessite pas d’installer un programme tiers. Vous gardez la maîtrise de l’échange des données avec vos clients. Vous êtes complètement autonome dans l’exploitation de nos bases Olfeo et leur intégration est extrêmement simple.

La base d’un poids de 2.5 Go s’intègre facilement sur n’importe quel alliance physique ou virtuelle. Sous la forme d’un fichier LMDB, la base est mise à jour de manière sécurisée et hebdomadaire pour garantir que les données restent à jour.

Pour assurer la qualité des données dans la base, un processus continu est en place:

1. La base de données s’enrichit continuellement par les remontées issues des navigations des utilisateurs des produits OLFEO, par des recherche de nouveaux domaines couvrant des thématiques ciblées mais aussi par la veille et l’exploitation de liste de domaines disponibles en sources ouvertes.

2. L’intégration d’un nouvel algorithme d’intelligence artificielle dans notre chaîne de pré-traitement automatique, en collaboration avec la DGA (Direction Générale de L’armement) nous offre une amélioration en continu et une précision améliorée lors de cette étape initiale de classification des domaines.

3. L’analyse humaine par nos équipes d’experts permet la confirmation de l’analyse automatique ou la correction le cas échéant.

4. Enfin, l’amélioration continue permet la veille sur les changements possibles de contenus et actualisation des catégories. Des nouvelles catégories sont également créées pour s’adapter aux évolutions d’usage d’internet. Par exemple, la catégorie IA Génératives a récemment été déployée pour répondre à la demande de nos clients qui avaient besoin de suivre la consommation de services liés à l’utilisation de IA génératives (ChatGPT etc.)

LES CAS D'USAGE

Olfeo OEM permet de couvrir un large panel de cas d’usages

La base de données d’URL Olfeo permet d’améliorer les solutions de cyber sécurité sur les aspects de filtrage notamment.

Avec un taux de reconnaissance supérieure à 99% et des faux positifs proches de 0, les éditeurs de solutions de cyber sécurité peuvent mettre en place un filtrage assurant à la fois un très haut niveau de sécurité contre les sites malicieux ou contenant des contenus illicites, mais aussi une finesse dans l’octroi des gestions d’accès en fonction des groupes ou catégories.

La base Olfeo OEM s’enrichit régulièrement avec de très nombreux sites de contrefaçon afin de pouvoir assister les marques dans leur veille contre l’émergence de ces menaces.

L’identification des sites web de contrefaçon, basée sur une expérience de classification de plus de 20 ans, nous permet de fournir aux marques, un premier niveau de détection et de classification des sites dits de contrefaçon.

Nos outils internes utilisant un algorithme d’apprentissage automatique, font la différence pour pré-identifier les sites web qui pourraient être considérés comme des sites frauduleux. Mais la technologie seule, ne suffit pas pour apporter une réponse assez fine. L’équipe des analystes expérimentés d’Olfeo procède à une vérification et une confirmation systématique de tous les sites avant la classification finale dans la catégorie en question.

Cette expertise de grande qualité est à l’origine de l’offre de contrefaçon Olfeo construite sur la combinaison de cette capacité d’analyse humaine et de nos puissants outils internes.

Les données issues des investigations et/ou des sources ouvertes sont souvent très volumineuses. Leur analyse est donc souvent rendue difficile d’autant qu’elle doit être souvent menée sur une période de temps limité. Il faut donc trouver l’information pertinente très rapidement.

Olfeo OEM enrichit les données et apporte du contexte pour faciliter les actions d’investigation avec un excellent niveau de fiabilité.