O Reddit bloqueou a Microsoft de pesquisar em seu site e usar os dados para treinar suas IAs

O CEO do Reddit, Steve Huffman, destacou o hábito secreto da Microsoft em uma reviravolta no mundo da tecnologia. O executivo fez uma declaração interessante sobre como a Microsoft usou a extensa coleta de dados do Reddit para ensinar seus serviços de IA sem o conhecimento do Reddit.
Em uma entrevista ao The Verge, Huffman mencionou que a Microsoft, Anthropic e Perplexity estão entre as empresas de IA que agiram como se a Internet fosse sua ostra, utilizando livremente conteúdo para treinar suas IAs. Isso ocorreu após o Reddit decidir tomar uma posição firme ao exigir que os motores de busca pagassem se quisessem acessar seus dados—até agora, apenas o Google pagou.
Huffman usou uma analogia clara para explicar como é difícil impedir que essas grandes empresas de tecnologia acessem os dados do Reddit. Ele disse que bloqueá-las é como tentar manter esquilos longe de um comedouro para pássaros. Apesar de a Microsoft fornecer opções de controles de rastreamento para webmasters, o Reddit decidiu usar outro motor de busca, que Huffman não mencionou.
Apesar disso, o Reddit bloqueou o Bing de rastrear seu site para pesquisa, favorecendo outro motor de busca e impactando a concorrência do Bing e de motores alimentados pelo Bing.
— Jordi Ribas (@JordiRib1) 29 de julho de 2024
Essa situação não se trata apenas do Reddit e da Microsoft. Em vez disso, oferece uma pequena visão da discussão mais ampla sobre como as empresas de tecnologia utilizam dados públicos para seus objetivos de IA. O comentário de Mustafa Suleyman, CEO da IA da Microsoft, de que os dados da internet têm sido “software livre” alimenta mais discussões, implicando um entendimento há muito estabelecido de que os dados podem ser usados para treinar inteligência artificial.
A posição de Huffman sugere uma mudança em como os criadores de conteúdo percebem sua conexão com os motores de busca e as empresas de IA. O antigo arranjo de troca de dados por tráfego parece estar mudando. À medida que a fome de dados da IA aumenta, as condições para a interação estão sendo redefinidas. A decisão do Reddit poderia criar um precedente, motivando fornecedores de conteúdo adicionais e impedindo rastreadores de concordarem.
Esta história em andamento de Reddit versus Microsoft é mais significativa do que uma simples desacordo dramático entre duas empresas. Ela representa uma questão crucial de nossos tempos, mostrando a conexão intrincada entre a privacidade dos dados, o desenvolvimento da inteligência artificial e os princípios fundamentais sobre os quais a Internet funciona.