La fraude aux panels est-elle la nouvelle fraude publicitaire ? Un problème choquant qui touche les études de marché, résolu grâce à l'IA.

La qualité des données est essentielle pour les directeurs marketing qui ont besoin d'en tirer des enseignements, 89 % des acheteurs s'accordant à dire qu'il s'agit de leur priorité numéro un. Dans cet article, nous faisons le point sur la fraude et expliquons comment Kantar peut y remédier grâce à l'IA et à d'autres solutions de pointe.

La qualité des données est essentielle pour les directeurs marketing qui doivent dégager des informations pertinentes, 89 % des acheteurs s’accordant à dire qu’il s’agit de leur priorité numéro un (source : Greenbook, rapport 2023 de GRIT Insights Practice).

Un engagement récent en faveur de la qualité dans le secteur prend de l’ampleur, à mesure que de plus en plus d’acheteurs, de vendeurs et de prestataires comprennent que ce problème doit être résolu.

Comme le souligne Jane Frost, PDG de la Market Research Society : «Les activités frauduleuses deviennent de plus en plus sophistiquées, en particulier dans les études en ligne. Elles constituent un risque important pour l’avenir de notre secteur. »

La qualité des données devrait être un facteur essentiel sur lequel les acheteurs d’insights peuvent compter, mais la fraude endémique persiste depuis des années. Et c’est un sujet étrangement peu abordé dans l’ensemble dusecteur. La fraude aux panels ressemble à la fraude publicitaire ou aux fermes à clics de cette décennie – et s’industrialise rapidement.

Pire encore, à mesure que les taux de fraude augmentent, les variations dans les données qui en découlent s'accentuent également.

Dans cet article, nous faisons le point sur la fraude et expliquons comment Kantar peut y remédier grâce à l’IA et à d’autres solutions de pointe.

À l’échelle mondiale, trois grands défis sectoriels affectent les panels :

1. La course aux audiences: comment rivaliser pour gagner le temps précieux des panélistes ?
2. Le renforcement des exigences en matière de conformité à la protection des données: le RGPD diffère de la CPPA, par exemple.
3. L’augmentation des niveaux de fraude en ligne. Les « taux de réconciliation » – le pourcentage d’échantillons rejetés pour cause de mauvaise qualité – ont augmenté d’environ 300 % au cours des trois dernières années, et les clients rejettent jusqu’à 40 % des données après la collecte.

Les propriétaires de panels doivent gérer chacun de ces trois facteurs de manière intelligente et stratégique.

1. Attirer l'attention

Tout commence par la manière dont nous traitons nos panélistes : non pas comme une marchandise, mais comme une ressource précieuse. Nous cherchons constamment à améliorer la formulation de nos questions, la durée des entretiens (LoI) et à renforcer la gamification. Nous considérons nos panélistes comme des personnes à part entière en répondant à leurs questions et en leur accordant toute notre attention. Grâce à notre algorithme unique de mise en correspondance des enquêtes, nous associons chaque panéliste à l’enquête qui lui convient, afin que les bonnes personnes répondent aux bonnes enquêtes, à leur propre rythme. Cela permet de réduire les abandons et les exclusions, ce qui se traduit par 175 % de questionnaires remplis en plus par rapport à la moyenne du secteur. En combinant notre approche consistant à traiter les répondants comme des personnes appréciées et une technologie de panel avancée, nous constatons que nos panélistes sont satisfaits et engagés. Ils attribuent à notre application une note de 4,2 sur Trustpilot et laissent des commentaires positifs tels que : « L'ambiance est positive, et j'ai beaucoup appris grâce aux enquêtes en ligne, tout en voyant mon compte en banque se remplir ! »

2. Le renforcement des exigences en matière de conformité aux règles de protection des données

Kantar joue un rôle de premier plan dans les débats sectoriels et les groupes de travail (par exemple, ESOMAR). Nous disposons également d’une équipe interne de spécialistes qui suit en permanence l’évolution des réglementations en matière de confidentialité et de consentement, et veille à ce que nous disposions des solutions techniques adéquates pour la collecte, le stockage et la suppression des données.

En Chine, par exemple, nous disposons d’une plateforme de gestion d’échantillons spécifique, conforme à la loi PIPL, pour la collecte de données approuvée par la CAC, offrant une série d’optimisations adaptées au marché. Elle est entièrement hébergée dans le cyberespace chinois et offre un accès programmatique à notre panel mobile WeChat en propriété exclusive : un accès à 1,5 million de personnes difficiles à atteindre. Nous disposons également de multiples niveaux de prévention de la fraude et de contrôles qualité qui garantissent que chaque compte WeChat est lié à un compte bancaire réel et unique. Les identifiants hachés et les liens vers les enquêtes sont cryptés à l'aide de MD5 et de Wave Secret, afin de limiter les réponses fantômes et les réponses frauduleuses par des pirates informatiques.

3. L'augmentation des cas de fraude en ligne

Plus des deux tiers des alertes relatives à la qualité des données (69 %) sont attribuées à différents types de fraude. Parmi ceux-ci, 41 % proviennent de pirates informatiques internationaux, 13 % de bots connus, 7 % de « ghost completes » (lorsqu'un répondant semble avoir rempli un questionnaire mais qu'aucune donnée n'est collectée en raison de la mise en place de liens de redirection) et 8 % de doublons (lorsqu'un répondant remplit plusieurs questionnaires, généralement après avoir créé de nombreux comptes frauduleux en se faisant passer pour des personnes appartenant à différentes catégories démographiques).

Afin de garantir la meilleure qualité de données possible, nous avons classé la fraude en trois types:

• Panélistes désengagés: ils effectuent plusieurs tâches à la fois et répondent aux enquêtes de manière mécanique, ce qui remet en question la précision des réponses. L'impact sur l'intégrité des données est modéré à faible. Ces panélistes ont besoin d'être guidés et leur comportement doit être surveillé. Il peut être nécessaire de les exclure de certaines études.

• Panélistes malhonnêtes: ils mentent sur leur identité et répondent à davantage d’enquêtes pour gagner des récompenses plus rapidement. L’impact sur l’intégrité des données est modéré à élevé.

• Panélistes frauduleux: ils agissent seuls ou en groupe pour pirater des enquêtes et gagner des récompenses en masse – les nouvelles « fermes à clics », si l’on veut. Il s’agit d’une fraude grave, à grande échelle, ayant un impact important sur l’intégrité des données.

Quelles mesures Kantar prend-elle pour lutter contre chacun de ces types de fraude ? Et comment utilisons-nous les outils d'IA et d'IA générative de pointe pour y faire face ?

• Nous encourageons une conception de sondage de qualité: la qualité d’un sondage dépend de sa conception, de sa longueur et de l’expérience utilisateur. Même les participants les plus engagés peuvent se désintéresser si ces facteurs ne sont pas pris en compte.

• Nous évitons les erreurs dues au manque d’engagement: certains panélistes donnent des réponses incohérentes par incompréhension, et d’autres ne sont pas ceux qu’ils prétendent être ; mais tous les problèmes signalés ne résultent pas d’une tromperie délibérée. Certains sont des erreurs innocentes, et toutes les actions signalées ne nuisent pas à l’intégrité des données. Nous voulons inclure tous les participants sincères. Nous proposons donc une formation aux panélistes et leur donnons la possibilité d’améliorer leur comportement, si nécessaire.

• Nous définissons la qualité: comme elle est subjective, nous utilisons des indicateurs objectifs. Il est essentiel de reconnaître les différents niveaux de mauvaise qualité et les divers facteurs qui y contribuent. La division Profiles de Kantar s’appuie sur plus de 20 ans d’expertise approfondie en matière de panels, combinée à la technologie et à l’IA, pour y parvenir en temps réel via Qubed AI, son outil anti-fraude propriétaire. Qubed AI fonctionne en temps réel, s’appuie sur 5 réseaux neuronaux profonds (autrement dit, un apprentissage automatique avancé), est entraîné quotidiennement à partir de plus de 60 millions d’événements et traite plus de 300 caractéristiques pour chaque session d’enquête afin d’attribuer automatiquement une note et de rendre un verdict ainsi qu’une suggestion d’action sur la fraude éventuelle d’un panéliste, en quelques millisecondes – ce qu’un être humain (et d’autres technologies anti-fraude) ne pourrait tout simplement pas faire.

• Nous utilisons GenAI avec la validation ouverte Qubed: nous utilisons notre solution propriétaire d’évaluation des réponses ouvertes basée sur ChatGPT, qui note les réponses ouvertes des panélistes selon plusieurs dimensions. Les facteurs que nous détectons comprennent la pertinence par rapport à la question posée, l’originalité, l’exhaustivité, le langage, les réponses plagiées, l’utilisation d’informations personnelles identifiables, l’argot, l’utilisation d’abréviations, ainsi que les propos grossiers, racistes, le charabia et les réponses générées par ChatGPT. Pour en savoir plus sur la manière dont la validation ouverte Qubed de Kantar lutte contre la fraude, consultez cet article que nous avons publié précédemment, intitulé « Transformer les panels : comment Kantar utilise-t-il les LLM pour améliorer les réponses des panels? »

• Lancement de Qubed Facial Verification: la dernière avancée de Kantar dans la lutte contre la fraude aux sondages a été l’intégration de Realeyes Verify dans notre IA Qubed. Verify est une technologie de vérification faciale légère, entraînée sur un ensemble de données unique provenant de 17 millions de sessions de sondage avec consentement, capturées par webcam. Nous pouvons ainsi identifier rapidement les personnes mal intentionnées qui tentent de rejoindre nos panels Premium.

Les directeurs marketing et les responsables de l’analyse des données doivent comprendre comment leurs partenaires de panel accordent la priorité à la qualité des données, et avoir l’assurance que ces derniers fournissent des données précises et en temps opportun, exemptes de réponses frauduleuses.

Alors que l’ensemble du secteur s’engage en faveur de la qualité par le biais du Quality Pledge et d’autres initiatives, Kantar est bien placé pour continuer à jouer un rôle de premier plan dans l’élimination de la fraude et le rétablissement d’une plus grande confiance dans le secteur des données consommateurs, grâce à l’utilisation intelligente de l’IA.

‍