Les extensions de navigateur peuvent utiliser votre PC pour le web scraping : comment vous protéger

ordinateur portable sur une table avec des hologrammes de pages web sortant de l'écran

Des centaines d’extensions de navigateur pour Chrome, Firefox et Edge ont adopté une nouvelle tactique de monétisation : utiliser les ressources de votre PC pour extraire des données du web. Bien que ce ne soit pas strictement un logiciel malveillant – et souvent opéré avec votre consentement indirect – cette pratique reste assez douteuse. Si vous préférez ne pas avoir votre PC enrôlé dans des schémas de collecte de données, voici comment repérer ces extensions et les supprimer définitivement.

Pourquoi les extensions de navigateur utilisent-elles votre PC pour le web scraping

Les grandes entreprises dépendent fortement des données disponibles publiquement pour prendre des décisions basées sur les données et alimenter des initiatives d’IA. Cependant, utiliser des bots pour le web scraping n’est pas la meilleure solution, car la plupart des sites web bloquent les tentatives de scraping en masse. C’est pourquoi de nouvelles méthodes de web scraping astucieuses apparaissent de temps en temps, comme le web scraping par IA ou cette nouvelle technique de web scraping basée sur des extensions de navigateur.

Ces extensions ajoutent des iframes cachées qui ouvrent des sites web ciblés invisibles aux yeux des utilisateurs pour en extraire des données. De cette manière, les sites web sont ouverts comme si l’utilisateur les ouvrait, évitant ainsi de nombreux systèmes de détection de bots en place. Les données collectées sont ensuite vendues à des entreprises d’IA et à des sociétés d’analyse avides de données pour réaliser des profits.

Bien que ces extensions ne volent pas vos données personnelles, elles utilisent tout de même votre bande passante réseau et les ressources de votre PC pour ouvrir des pages web pour le scraping. De plus, elles suppriment temporairement des en-têtes de sécurité qui peuvent rendre votre navigateur vulnérable aux scripts intersites et au clickjacking.

Les méthodes ci-dessous peuvent vous aider à détecter de telles extensions pour les éviter.

Recherchez le consentement pour utiliser la bande passante

Bien que de nombreuses extensions aient essayé de le faire discrètement, elles ont déjà été supprimées. Par conséquent, beaucoup demanderont un consentement – généralement de manière trompeuse – pour se conformer. Dans la plupart des cas, elles demanderont à utiliser votre bande passante inactive pour “soutenir” le développeur sans expliquer explicitement comment la bande passante sera utilisée. Certaines pourraient simplement demander : “Soutenez le développeur gratuitement” pour activer le web scraping.

description de l'extension Chrome concernant le partage de bande passante

Il existe également certaines qui vous permettent de donner votre bande passante gratuite en échange de quelque chose de bien. Par exemple, l’extension Idle forest utilise la même technologie pour vous permettre de planter des arbres gratuitement. Si vous trouvez un tel consentement soit dans la description de l’extension, soit après l’avoir installée, il vaut mieux s’en éloigner.

Utilisez l’outil d’évaluation des risques Spin-AI

L’outil d’évaluation des risques Spin-AI vous permet de rechercher votre extension Chrome ou Firefox préférée pour savoir à quel point elle est risquée. Il utilise de nombreux facteurs pour conclure à quel point elle peut être risquée ; nous voulons nous concentrer sur les autorisations risquées pour ces extensions de web scraping. Cependant, il n’examine pas toutes les extensions disponibles, donc il y a une chance qu’il n’ait pas vérifié votre extension spécifique, surtout si elle est nouvelle.

Avant d’installer une extension, recherchez son nom sur l’outil d’évaluation des risques Spin-AI. Il affichera toutes les extensions connexes avec un score de risque. Si vous trouvez votre extension, cliquez dessus pour en savoir plus. Sous la section Permissions, vous devez rechercher les deux permissions “tous les urls” et “declarativeNetRequest” car elles sont indispensables pour que de telles extensions fonctionnent.

liste des autorisations d'extension sur Spin.AI

Normalement, ces deux permissions ensemble ne sont pas nécessaires pour la plupart des extensions. La plupart du temps, les extensions de sécurité et de confidentialité utilisent ces deux permissions, comme les anti-trackers, les bloqueurs de publicités et les extensions VPN/Proxy. Si une extension veut ces deux permissions, bien qu’elle n’ait pas besoin de modifier directement le trafic réseau ou d’accéder aux données sur tous les sites web, elle en a probablement besoin pour le web scraping.

En plus des permissions, l’outil d’évaluation des risques Spin.AI fournira également beaucoup d’informations sur l’extension et son développeur pour décider si elle est sûre ou non.

Surveillez l’utilisation des ressources en arrière-plan des extensions

Lorsque l’extension exécute un travail de web scraping en arrière-plan, elle consommera des ressources CPU/mémoire et de bande passante réseau. Si vous trouvez une extension suspecte, vous pouvez utiliser le gestionnaire de tâches du navigateur pour voir si elle utilise des ressources même lorsqu’elle n’est pas active.

Dans Chrome et les navigateurs basés sur Chromium, appuyez sur les touches Shift + Esc pour ouvrir le gestionnaire de tâches. Sur Firefox, tapez about:processes dans la barre d’adresse pour accéder aux processus en arrière-plan. Lorsque vous n’utilisez pas activement l’extension et qu’elle apparaît toujours ici, cela signifie qu’elle exécute des processus en arrière-plan. Pour confirmer davantage si elle effectue du scraping sur le web, vérifiez si les ressources CPU et réseau sont utilisées.

Gestionnaire de tâches Chrome affichant la liste des processus

Certaines de ces extensions peuvent ne pas commencer immédiatement à scraper le web ou ne le faire que lorsque le PC est inactif, donc vous devrez peut-être vérifier les processus plusieurs fois pour les attraper.

En plus de ces méthodes, vous pouvez également suivre votre connexion réseau pour voir si des connexions inattendues sont établies. En utilisant un logiciel de pare-feu, vous pouvez à la fois suivre les connexions et les bloquer.