ブラウザ拡張機能があなたのPCをウェブスクレイピングに利用する可能性: 自分を守る方法

画面からホログラムが出ているテーブルの上のノートパソコン

数百のChrome、Firefox、Edge用のブラウザ拡張機能が新しいマネタイズ戦略を採用しました: あなたのPCのリソースを利用してウェブをスクレイピングすることです。厳密にはマルウェアではありませんが、しばしばあなたの間接的な同意のもとで動作しているため、この行為は依然として非常に怪しいものです。データ収集のスキームにあなたのPCが利用されることを望まない場合、これらの拡張機能を見分けて永久に削除する方法を紹介します。

なぜブラウザ拡張機能がウェブスクレイピングにあなたのPCを使用するのか

大企業はデータ駆動の意思決定やAIイニシアチブの推進のために、公開されているデータに大きく依存しています。しかし、ボットを使用してウェブスクレイピングを行うことは最良の解決策ではありません。ほとんどのウェブサイトは、大量のウェブスクレイピングの試みをブロックします。これが、新しい巧妙なウェブスクレイピング手法が時折現れる理由です。例えば、AIウェブスクレイピングやこの新しいブラウザ拡張機能ベースのウェブスクレイピング技術です。

これらの拡張機能は、ユーザーの視界から隠されたターゲットウェブサイトを開く隠れたiframeを追加し、そこからデータをスクレイピングします。この方法では、ウェブサイトはユーザーが開いているかのように開かれるため、多くのボット検出システムを回避します。収集されたデータは、AI企業やデータを欲しがる分析会社に販売され、利益を得ます。

これらの拡張機能はあなたの個人データを盗むわけではありませんが、ウェブページを開くためにあなたのネットワーク帯域幅とPCリソースを利用します。さらに、ブラウザをクロスサイトスクリプティングやクリックジャッキングに対して脆弱にする可能性のあるセキュリティヘッダーを一時的に削除します。

以下の方法は、そのような拡張機能を検出して避けるのに役立ちます。

帯域幅使用の同意を探す

多くの拡張機能はこれを密かに行おうとしましたが、すでに削除されています。そのため、多くは同意を求めます - 通常は欺瞞的に - これに従うためです。ほとんどの場合、開発者を「サポート」するためにあなたのアイドル帯域幅を使用することを求めますが、帯域幅がどのように使用されるかは明示的に伝えません。中には「無料で開発者をサポートする」とだけ尋ねてウェブスクレイピングを有効にするものもあります。

帯域幅共有に関するChrome拡張機能の説明

また、何か良いものと引き換えに無料の帯域幅を提供できるものもあります。例えば、Idle forest拡張機能は、同じ技術を使用して無料で木を植えることを可能にします。このような同意を拡張機能の説明やインストール後に見つけた場合は、避けた方が良いでしょう。

Spin-AIリスク評価ツールを使用する

Spin-AIリスク評価ツールを使用すると、お気に入りのChromeまたはFirefox拡張機能を検索して、そのリスクの程度を知ることができます。多くの要因を使用してリスクの程度を結論付けますが、私たちはこれらのウェブスクレイピング拡張機能にとってリスクの高い権限に焦点を当てたいと思います。ただし、すべての拡張機能を調査しているわけではないため、特に新しい場合は、特定の拡張機能が評価されていない可能性があります。

拡張機能をインストールする前に、Spin-AIリスク評価ツールでその名前を検索してください。関連するすべての拡張機能とそのリスクスコアが表示されます。拡張機能を見つけたら、クリックして詳細を確認してください。権限セクションでは、これらの拡張機能が機能するために必要な「すべてのURL」「declarativeNetRequest」の2つの権限を探す必要があります。

Spin.AIの拡張機能権限のリスト

通常、これらの2つの権限はほとんどの拡張機能が機能するために必要ありません。主に、セキュリティおよびプライバシー拡張機能がこれらを一緒に使用します。例えば、アンチトラッカー、広告ブロッカー、VPN/プロキシ拡張機能などです。拡張機能がこれらの両方の権限を要求する場合、ネットワークトラフィックを直接変更したり、すべてのウェブサイトのデータにアクセスしたりする必要はありませんが、ウェブスクレイピングのために必要な可能性があります。

権限に加えて、Spin.AIリスク評価ツールは、拡張機能とその開発者に関する多くの情報も提供し、安全かどうかを判断するのに役立ちます。

拡張機能のバックグラウンドリソース使用を監視する

拡張機能がバックグラウンドでウェブスクレイピングのジョブを実行していると、CPU/メモリリソースとネットワーク帯域幅を消費します。拡張機能が疑わしい場合は、ブラウザのタスクマネージャーを使用して、アクティブでないときでもリソースを使用しているかどうかを確認できます。

ChromeおよびChromiumベースのブラウザでは、Shift + Escキーを押してタスクマネージャーを開きます。Firefoxでは、アドレスバーにabout:processesと入力してバックグラウンドプロセスにアクセスします。拡張機能を積極的に使用していないときにここに表示される場合、それはバックグラウンドプロセスを実行していることを意味します。ウェブをスクレイピングしているかどうかをさらに確認するには、CPUとネットワークリソースの両方が使用されているかどうかを確認してください。

プロセスのリストを表示するChromeタスクマネージャー

これらの拡張機能のいくつかは、すぐにウェブをスクレイピングし始めないか、PCがアイドル状態のときだけ行う場合があるため、プロセスを複数回確認する必要があるかもしれません。

これらの方法に加えて、ネットワーク接続を追跡して、予期しない接続が行われているかどうかを確認することもできます。ファイアウォールソフトウェアを使用すると、接続を追跡し、ブロックすることができます。