Extensões de Navegador Podem Usar Seu PC Para Web Scraping: Como se Proteger

laptop on table with webpages holograms coming out of screen

Centenas de extensões de navegador para Chrome, Firefox e Edge adotaram uma nova tática de monetização: aproveitar os recursos do seu PC para fazer scraping na web. Embora não sejam estritamente malware – e muitas vezes operando com seu consentimento indireto – essa prática ainda é bastante duvidosa. Se você prefere não ter seu PC recrutado em esquemas de coleta de dados, aqui está como identificar essas extensões e removê-las de vez.

Por Que Extensões de Navegador Estão Usando Seu PC Para Scraping na Web

Grandes empresas dependem fortemente de dados disponíveis publicamente para decisões baseadas em dados e para impulsionar iniciativas de IA. No entanto, usar bots para web scraping não é a melhor solução, já que a maioria dos sites bloqueia tentativas de scraping em massa. É por isso que novos e engenhosos métodos de scraping na web surgem de tempos em tempos, como scraping na web com IA ou essa nova técnica de scraping baseada em extensões de navegador.

Essas extensões adicionam iframes ocultos que abrem sites-alvo escondidos da visão dos usuários para coletar dados deles. Dessa forma, os sites são abertos como se o usuário estivesse abrindo-os, evitando muitos sistemas de detecção de bots em funcionamento. Os dados coletados são então vendidos para empresas de IA e firmas de análise famintas por dados para lucro.

Embora essas extensões não roubem seus dados pessoais, elas ainda utilizam sua largura de banda de rede e recursos do PC para abrir páginas da web para scraping. Além disso, elas também removem temporariamente cabeçalhos de segurança que podem tornar seu navegador suscetível a scripts entre sites e clickjacking.

Os métodos abaixo podem ajudá-lo a detectar tais extensões para evitá-las.

Procure Por Consentimento Para Usar Largura de Banda

Embora muitas extensões tenham tentado fazer isso de forma furtiva, elas já foram removidas. Portanto, muitas pedirão consentimento – geralmente de forma enganosa – para se adequar. Na maioria dos casos, elas pedirão para usar sua largura de banda ociosa para “apoiar” o desenvolvedor sem dizer explicitamente como a largura de banda será utilizada. Algumas podem apenas perguntar: “Apoie o desenvolvedor gratuitamente” para ativar o scraping na web.

Chrome extension description about sharing bandwidth

Há também algumas que permitem que você ofereça sua largura de banda gratuita em troca de algo bom. Por exemplo, a extensão Idle forest usa a mesma tecnologia para permitir que você plante árvores gratuitamente. Se você encontrar tal consentimento na descrição da extensão ou após instalá-la, é melhor ficar longe.

Use a Ferramenta de Avaliação de Risco Spin-AI

A ferramenta de Avaliação de Risco Spin-AI permite que você pesquise sua extensão favorita do Chrome ou Firefox para saber quão arriscada ela é. Ela usa muitos fatores para concluir quão arriscada pode ser; queremos nos concentrar nas permissões arriscadas para essas extensões de scraping na web. No entanto, ela não examina todas as extensões disponíveis, então há uma chance de que ela não tenha avaliado sua extensão específica, especialmente se for nova.

Antes de instalar uma extensão, pesquise seu nome na ferramenta de Avaliação de Risco Spin-AI. Ela mostrará todas as extensões relacionadas junto com uma pontuação de quão arriscadas elas são. Se você encontrar sua extensão, clique nela para saber mais. Na seção Permissões, você precisa procurar as duas permissões “todas as urls” e “declarativeNetRequest” pois são essenciais para que tais extensões funcionem.

list of extension permissions on Spin.AI

Normalmente, essas duas permissões juntas não são necessárias para a maioria das extensões funcionarem. Principalmente, extensões de segurança e privacidade usam essas permissões juntas, como anti-rastreadores, bloqueadores de anúncios e extensões de VPN/Proxy. Se uma extensão deseja ambas essas permissões, embora não precise modificar diretamente o tráfego da rede ou acessar dados em todos os sites, provavelmente precisa delas para scraping na web.

Além das permissões, a ferramenta de Avaliação de Risco Spin.AI também fornecerá muitas informações sobre a extensão e seu desenvolvedor para decidir se é segura ou não.

Monitore o Uso de Recursos em Segundo Plano das Extensões

Quando a extensão executa um trabalho de scraping na web em segundo plano, ela consumirá alguns recursos de CPU/memória e largura de banda de rede. Se você achar uma extensão suspeita, pode usar o gerenciador de tarefas do navegador para ver se ela está usando recursos mesmo quando não está ativa.

No Chrome e em navegadores baseados em Chromium, pressione as teclas Shift + Esc para abrir o gerenciador de tarefas. No Firefox, digite about:processes na barra de endereços para acessar processos em segundo plano. Quando você não está usando ativamente a extensão e ela ainda aparece aqui, isso significa que está executando processos em segundo plano. Para confirmar ainda mais se está fazendo scraping na web, veja se tanto os recursos de CPU quanto de rede estão em uso.

Chrome Task Manager showing list of processes

Algumas dessas extensões podem não começar imediatamente a fazer scraping na web ou só o fazem quando o PC está ocioso, então você pode ter que verificar os processos várias vezes para pegá-las.

Além desses métodos, você também pode monitorar sua conexão de rede para ver se alguma conexão inesperada está sendo feita. Usando um software de firewall, você pode tanto rastrear conexões quanto bloqueá-las.