Optimiser les performances publicitaires grâce au machine learning avancé et aux bases de données vectorielles

Mis à jour le 30 novembre 2023

Les marketeurs sont aujourd’hui soumis à une pression inédite. Ces derniers doivent en effet composer avec un paysage publicitaire en constante évolution et toujours plus coûteux, le durcissement des réglementations et l’incertitude macroéconomique, autant de facteurs qui accroissent progressivement leur dépendance aux activités de marketing digital à la performance. Dans un contexte où chaque achat est soigneusement pesé par le consommateur, les tactiques avancées du haut du funnel jouent un rôle crucial dans les transactions effectuées et les revenus engrangés.

Chez Criteo, la technologie et l’innovation sont au cœur de nos actions. C’était vrai à nos débuts, lorsque nous avons lancé notre service de recommandation de films, et c’est encore vrai aujourd’hui, plus de quinze ans plus tard. L’IA est inscrite dans notre ADN. C’est pourquoi nous nous efforçons au quotidien d’améliorer nos solutions basées sur l’IA et de générer des résultats qualitatifs pour les campagnes publicitaires de nos clients. Aujourd’hui, nous avons le plaisir de vous présenter DeepKNN, la toute dernière amélioration de notre moteur de recommandations. DeepKNN est la base de données vectorielle avancée de Criteo, dont les capacités de deep learning alimentent déjà des aspects importants de nos gammes de produits.

Notre approche se veut concrète : au moment du lancement bêta de DeepKNN au sein de notre système de recommandation, nous avons pu observer une nette augmentation de tous les indicateurs d’engagement. Si les performances varient en fonction des clients, nous favorisons aussi bien la hausse des taux de clics que du revenu attribué, qui dépasse souvent les 10 % ! En un mot, notre IA avancée génère de meilleures performances à grande échelle pour les marketeurs.

Comment est-ce que DeepKNN génère de meilleures performances ? Dans la section suivante, nous expliquerons brièvement le fonctionnement de DeepKNN et son rôle dans l’amélioration des performances de campagne.

Qu’est-ce que DeepKNN ?

DeepKNN est la forme abrégée de « Deep Learning Representation for K-Nearest Neighbors Search » DeepKNN allie les capacités de pointe d’une base de données vectorielle et de la technologie de deep learning. Ce framework alimente actuellement la plupart des campagnes publicitaires de Criteo. Il fournit de meilleures recommandations de produits aux consommateurs et des indicateurs d’engagement améliorés aux annonceurs.
DeepKNN est l’alliance de deux technologies puissantes :

  • Un réseau neuronal profond qui traite l’ensemble des informations sur les produits et l’activité des consommateurs (comme le montre le pipeline de traitement représenté en Figure 1).
  • Une base de données vectorielle (VectorDB) qui stocke les vecteurs des produits et consommateurs et nous permet de trouver en temps réel les produits les plus semblables aux requêtes des internautes (comme le montre le processus de récupération représenté en Figures 2a et 2b).

Le processus d’indexage des produits dans VectorDB : Étape 1) Assimiler toutes les informations disponibles (images, texte, activité des utilisateurs). Étape 2) Transformer ces informations en représentations vectorielles grâce au deep learning. Étape 3) Stocker ces informations dans VectorDB.

La puissance des représentations vectorielles

En quoi est-il utile d’associer des vecteurs à tous nos produits et consommateurs ? C’est parce que les vecteurs nous permettent de trouver la meilleure correspondance entre un consommateur et un produit ou service donné. Grâce à la représentation vectorielle des consommateurs et produits, nous pouvons intégrer et visualiser notre compréhension des affinités entre consommateurs et produits sous forme de distance entre chaque point. Comme illustré à droite en Figure 2a, l’espace vectoriel contient un ensemble de consommateurs et de produits placés à divers endroits sur un plan 2D. Nous constatons alors que le simple fait de les placer dans un espace 2D nous permet de définir des clusters implicites de produits similaires, par exemple pour les chaussures, la mode, la technologie et les voyages. Une fois les consommateurs et produits placés dans l’espace, notre base de données vectorielle affiche rapidement les associations les plus proches (ou vecteurs de consommateurs) pour chaque consommateur ou produit donné. C’est sur cette approche que reposent nos produits de recommandation et de gestion des audiences.

Quel est l’impact de DeepKNN sur les campagnes des marketeurs ?

Grâce à DeepKNN, les annonceurs peuvent améliorer leurs campagnes de plusieurs façons :

  • Recommandations personnalisées: DeepKNN fournit des recommandations personnalisées aux clients en fonction de leur comportement et de leurs préférences, ce qui donne lieu à des taux de conversion plus élevés et de meilleures performances de campagne en général. (Voir Figure 2b ci-dessous).
  • Audiences améliorées: DeepKNN peut aider à identifier des habitudes et similarités dans le comportement des consommateurs qui ne sont pas forcément évidentes au premier abord. Le regroupement, ou clustering, des consommateurs par comportement similaire est un bon moyen d’affiner le ciblage publicitaire, et donc d’accroître l’engagement et les taux de conversion. (Voir Figure 2a ci-dessous).
  • Récupération des données accélérée: avec DeepKNN, nous sommes en mesure d’effectuer des recherches rapides au sein de larges ensembles de données afin de trouver les résultats les plus pertinents. Cet avantage est essentiel pour prendre des décisions en temps réel dans le cadre de la publicité à la performance, où chaque milliseconde compte.
  • Contenus publicitaires améliorés: l’analyse du contenu de nos publicités avec DeepKNN nous permet d’identifier des habitudes et similarités qui parleront à notre audience cible. Ainsi, nous pouvons créer des contenus publicitaires plus efficaces, qui génèreront à leur tour des résultats supérieurs.


Génération d’audience grâce à la recherche dans VectorDB : à partir d’un produit dont nous recherchons le vecteur dans la base de données, nous récupérons les vecteurs d’utilisateurs les plus proches et les intégrons à l’audience appropriée.

Améliorer le reciblage des recommandations de produits avec DeepKNN

La réussite d’une campagne de reciblage repose sur la pertinence des recommandations. L’architecture de notre solution de recommandation actuelle pour le reciblage se compose de deux phases afin d’assurer la prise en charge de milliers de requêtes par seconde. Au cours de la première phase, nous calculons plusieurs types de similarités entre les différents articles ainsi que les produits populaires ou en tendance. La deuxième phase consiste ensuite à reclasser les produits les plus adaptés en fonction des informations les plus récentes sur les préférences du consommateur, le but étant de générer en temps réel les annonces les plus pertinentes.

L’intégration de DeepKNN à nos recommandations de produits contribue à perfectionner le calcul des similarités entre des articles (populaires, rares et nouveaux, par exemple), et donc de les détecter plus facilement qu’auparavant. Résultat : les recommandations correspondent davantage aux centres d’intérêt des consommateurs. DeepKNN présente en outre l’avantage non négligeable de la centralisation : le fait de placer nos produits et consommateurs au même endroit nous permet de rechercher des millions d’associations en temps réel, et ainsi de continuellement mettre à jour les listes des principaux produits similaires pour chaque consommateur.

Recommandations avec la recherche dans VectorDB : à partir d’un consommateur dont nous recherchons le vecteur dans la base de données, nous récupérons les vecteurs des produits les plus proches et les intégrons pour formuler des recommandations.

Avenir des performances avec les bases de données vectorielles et les capacités de deep learning

À l’heure où se démocratise l’accès programmatique aux capacités d’IA telles que ChatGPT et les incorporations de l’API par OpenAI (capables de transformer n’importe quel document en vecteur), les entreprises sont de plus en plus nombreuses à découvrir la puissance du deep learning et de la recherche vectorielle. À nos yeux, cette tendance atteste de l’importance des bases de données vectorielles dans le digital marketing moderne, car elles aident les annonceurs à exploiter plus efficacement les innombrables données disponibles.

Le recours à des algorithmes de deep learning, à la recherche avancée de similarités et aux techniques de clustering sont autant d’atouts offerts par des bases de données vectorielles telles que DeepKNN, qui aident les annonceurs à identifier les clusters de shoppers dont les préférences se rejoignent. En retour, ils ont accès à un ciblage d’audience plus efficace, des recommandations plus pertinentes et de meilleurs contenus publicitaires, le tout grâce à un système de recherche bien plus rapide et évolutif que les architectures traditionnelles.

Nous sommes fiers d’avoir su nous positionner en pionniers de cette tendance, et nous avons la conviction que notre nouveau moteur décisionnel en ligne est un grand pas pour la publicité à la performance. Nos capacités de deep learning et techniques de recherche vectorielle sont mises au service de nos clients pour leur offrir un nouvel outil puissant d’optimisation de leurs campagnes. Nous sommes impatients de voir l’utilisation que nos clients feront de DeepKNN afin de générer de meilleurs résultats et un ROI supérieur, et nous nous réjouissons de pouvoir continuer à innover dans ce domaine au cours des années à venir.

Pour découvrir comment DEEPKNN et le machine learning peuvent améliorer les performances de vos campagnes, contactez un expert.

Romain Lerallut

Romain Lerallut is VP Engineering at Criteo and head of the Criteo AI Lab, in charge of developing the uses of AI in digital advertising and commerce. Before the launch of the lab in 2018, he was a director in the engineering department, responsible for the development of large-scale machine ...

VP Engineering
Flavian Vasile

Flavian Vasile is a Principal ML Architect in the Criteo AI Lab, leveraging over 15 years of expertise in Machine Learning applications for Online Advertising. He specializes in developing Deep Learning techniques for Performance Advertising and actively explores the potential of cutting-edge AI ...