Browser-Erweiterungen können Ihren PC für Web-Scraping nutzen: So schützen Sie sich

Hunderte von Browser-Erweiterungen für Chrome, Firefox und Edge haben eine neue Monetarisierungstaktik übernommen: Sie nutzen die Ressourcen Ihres PCs, um das Web zu scrapen. Obwohl dies nicht strikt Malware ist – und oft mit Ihrem indirekten Einverständnis funktioniert – ist diese Praxis dennoch ziemlich fragwürdig. Wenn Sie nicht möchten, dass Ihr PC in Datensammelprogramme einbezogen wird, erfahren Sie hier, wie Sie diese Erweiterungen erkennen und sie dauerhaft entfernen können.
Warum Browser-Erweiterungen Ihren PC für das Scraping des Webs nutzen
Große Unternehmen sind stark auf öffentlich verfügbare Daten angewiesen, um datengestützte Entscheidungen zu treffen und KI-Initiativen zu fördern. Die Verwendung von Bots für Web-Scraping ist jedoch nicht die beste Lösung, da die meisten Websites Massen-Web-Scraping-Versuche blockieren. Aus diesem Grund tauchen von Zeit zu Zeit neue und clevere Web-Scraping-Methoden auf, wie KI-Web-Scraping oder diese neue browsererweiterungsbasierte Web-Scraping-Technik.
Diese Erweiterungen fügen versteckte Iframes hinzu, die gezielte Websites öffnen, die für die Benutzer unsichtbar sind, um Daten von ihnen zu scrapen. Auf diese Weise werden die Websites so geöffnet, als ob der Benutzer sie öffnet, wodurch viele Bot-Erkennungssysteme umgangen werden. Die gesammelten Daten werden dann an KI-Unternehmen und datensammelnde Analysefirmen zum Profit verkauft.
Während diese Erweiterungen Ihre persönlichen Daten nicht stehlen, nutzen sie dennoch Ihre Netzwerkbandbreite und PC-Ressourcen, um Webseiten für das Scraping zu öffnen. Darüber hinaus entfernen sie vorübergehend Sicherheitsheader, die Ihren Browser anfällig für Cross-Site-Scripting und Clickjacking machen können.
Die folgenden Methoden können Ihnen helfen, solche Erweiterungen zu erkennen, um sie zu vermeiden.
Achten Sie auf die Zustimmung zur Nutzung der Bandbreite
Während viele Erweiterungen versucht haben, dies heimlich zu tun, wurden sie bereits entfernt. Daher werden viele um Zustimmung bitten – normalerweise täuschend – um konform zu sein. In den meisten Fällen werden sie um die Nutzung Ihrer ungenutzten Bandbreite bitten, um den Entwickler zu “unterstützen”, ohne ausdrücklich zu sagen, wie die Bandbreite verwendet wird. Einige könnten einfach fragen: “Unterstützen Sie den Entwickler kostenlos”, um das Web-Scraping zu aktivieren.

Es gibt auch einige, die es Ihnen ermöglichen, Ihre kostenlose Bandbreite im Austausch für etwas Gutes zu geben. Zum Beispiel verwendet die Idle Forest-Erweiterung dieselbe Technologie, um Ihnen zu ermöglichen, kostenlos Bäume zu pflanzen. Wenn Sie eine solche Zustimmung entweder in der Erweiterungsbeschreibung oder nach der Installation finden, ist es besser, Abstand zu halten.
Verwenden Sie das Spin-AI-Risiko-Bewertungstool
Das Spin-AI-Risiko-Bewertungstool ermöglicht es Ihnen, Ihre Lieblings-Chrome- oder Firefox-Erweiterung zu durchsuchen, um herauszufinden, wie riskant sie ist. Es verwendet viele Faktoren, um zu schließen, wie riskant sie sein kann; wir möchten uns auf die riskanten Berechtigungen für diese Web-Scraping-Erweiterungen konzentrieren. Es untersucht jedoch nicht alle Erweiterungen, die es gibt, sodass die Möglichkeit besteht, dass es Ihre spezifische Erweiterung nicht geprüft hat, insbesondere wenn sie neu ist.
Bevor Sie eine Erweiterung installieren, suchen Sie nach ihrem Namen im Spin-AI-Risiko-Bewertungstool. Es zeigt alle verwandten Erweiterungen zusammen mit einer Bewertung, wie riskant sie sind. Wenn Sie Ihre Erweiterung finden, klicken Sie darauf, um mehr zu erfahren. Im Abschnitt Berechtigungen müssen Sie nach den beiden Berechtigungen „alle URLs“ und „declarativeNetRequest“ suchen, da diese für das Funktionieren solcher Erweiterungen erforderlich sind.

Normalerweise werden diese beiden Berechtigungen zusammen von den meisten Erweiterungen nicht benötigt, um zu funktionieren. In der Regel verwenden Sicherheits- und Datenschutz-Erweiterungen diese zusammen, wie Anti-Tracker, Werbeblocker und VPN/Proxy-Erweiterungen. Wenn eine Erweiterung beide Berechtigungen möchte, während sie nicht direkt den Netzwerkverkehr ändern oder Daten auf allen Websites zugreifen muss, benötigt sie sie wahrscheinlich für das Web-Scraping.
Neben den Berechtigungen gibt das Spin.AI-Risiko-Bewertungstool auch viele Informationen über die Erweiterung und ihren Entwickler, um zu entscheiden, ob sie sicher ist oder nicht.
Überwachen Sie die Hintergrundressourcennutzung von Erweiterungen
Wenn die Erweiterung im Hintergrund einen Web-Scraping-Job ausführt, verbraucht sie einige CPU-/Speicherressourcen und Netzwerkbandbreite. Wenn Sie eine Erweiterung verdächtig finden, können Sie den Task-Manager des Browsers verwenden, um zu sehen, ob sie Ressourcen verwendet, selbst wenn sie nicht aktiv ist.
In Chrome und Chromium-basierten Browsern drücken Sie die Tasten Shift + Esc, um den Task-Manager zu öffnen. In Firefox geben Sie about:processes in die Adresszeile ein, um auf Hintergrundprozesse zuzugreifen. Wenn Sie die Erweiterung nicht aktiv verwenden und sie hier immer noch erscheint, bedeutet das, dass sie Hintergrundprozesse ausführt. Um weiter zu bestätigen, ob sie das Web scrapt, sehen Sie nach, ob sowohl CPU- als auch Netzwerkressourcen in Gebrauch sind.

Einige dieser Erweiterungen beginnen möglicherweise nicht sofort mit dem Scraping des Webs oder tun dies nur, wenn der PC im Leerlauf ist, sodass Sie die Prozesse möglicherweise mehrmals überprüfen müssen, um sie zu erwischen.
Neben diesen Methoden können Sie auch Ihre Netzwerkverbindung überwachen, um zu sehen, ob unerwartete Verbindungen hergestellt werden. Mit einer Firewall-Software können Sie sowohl Verbindungen überwachen als auch blockieren.