Reddit a bloqué Microsoft d'explorer son site et d'utiliser les données pour entraîner ses IA

Microsoft Reddit Le PDG de Reddit, Steve Huffman, a souligné l’habitude secrète de Microsoft dans un retournement de situation technologique. Le directeur a fait une déclaration intéressante sur la façon dont Microsoft a utilisé la vaste collecte de données de Reddit pour enseigner ses services d’IA sans le savoir de Reddit.

Dans une interview avec The Verge, Huffman a mentionné que Microsoft, Anthropic et Perplexity figurent parmi les entreprises d’IA qui ont agi comme si Internet leur appartenait en utilisant librement du contenu pour entraîner leur IA. Cela est survenu après que Reddit a décidé de prendre une position ferme en demandant aux moteurs de recherche de payer s’ils souhaitent accéder à ses données - seul Google a payé jusqu’à présent.

Huffman a utilisé une analogie claire pour expliquer à quel point il est difficile d’empêcher ces grandes entreprises technologiques d’accéder aux données de Reddit. Il a dit que les bloquer revient à essayer d’empêcher des écureuils d’accéder à une mangeoire pour oiseaux. Même si Microsoft a proposé des options de contrôle de l’exploration pour les webmasters, Reddit a décidé d’utiliser un autre moteur de recherche, que Huffman n’a pas mentionné.

Malgré cela, Reddit a bloqué Bing de l’exploration de leur site pour la recherche, privilégiant un autre moteur de recherche et impactant la concurrence de Bing et des moteurs alimentés par Bing. — Jordi Ribas (@JordiRib1) 29 juillet 2024

Cette situation ne concerne pas uniquement Reddit et Microsoft. Au contraire, elle offre un petit aperçu du débat plus large concernant la façon dont les entreprises technologiques utilisent les données publiques à des fins d’IA. Le commentaire du PDG de Microsoft AI, Mustafa Suleyman, selon lequel les données Internet ont été des “logiciels gratuits”, suscite plus de discussions, impliquant une compréhension établie de longue date selon laquelle les données peuvent être utilisées pour entraîner l’intelligence artificielle.

La position de Huffman suggère un changement dans la façon dont les créateurs de contenu perçoivent leur relation avec les moteurs de recherche et les entreprises d’IA. L’ancien arrangement d’échange de données contre du trafic semble évoluer. À mesure que la soif de données des IA augmente, les conditions d’interaction sont en train d’être redéfinies. La décision de Reddit pourrait créer un précédent, incitant d’autres fournisseurs de contenu et empêchant les robots d’accepter.

Cette histoire en cours de Reddit contre Microsoft est plus significative qu’un simple désaccord dramatique entre deux entreprises. Elle représente une question cruciale de notre époque, montrant le lien complexe entre la confidentialité des données, le développement de l’intelligence artificielle et les principes fondamentaux sur lesquels fonctionne Internet.