Reddit заблокировал Microsoft от поиска на своем сайте и использования данных для обучения своих ИИ

Microsoft Reddit Генеральный директор Reddit, Стив Хаффман, подчеркнул секретную привычку Microsoft в повороте на технологическом рынке. Исполнитель сделал интересное заявление о том, как Microsoft использовал обширную сбор данных Reddit для обучения своих ИИ-сервисов без ведома Reddit.

В интервью The Verge Хаффман упомянул, что Microsoft, Anthropic и Perplexity — это среди ИИ-компаний, которые действовали так, словно Интернет — это их устрица, свободно используя контент для обучения своих ИИ. Это произошло после того, как Reddit решил занять четкую позицию, требуя, чтобы поисковые системы платили, если они хотят получить доступ к их данным — только Google пока заплатил.

Хаффман использовал ясную аналогию, чтобы объяснить, как трудно предотвратить доступ этих крупных технологических компаний к данным Reddit. Он сказал, что блокировка их напоминает попытку удержать белок от кормушки для птиц. Хотя Microsoft предоставила варианты для контроля обхода вебмастерами, Reddit решил использовать другую поисковую систему, которую Хаффман не упомянул.

Несмотря на это, Reddit заблокировал Bing от обхода их сайта для поиска, предпочитая другую поисковую систему и влияя на конкуренцию со стороны Bing и движков на его базе. — Jordi Ribas (@JordiRib1) 29 июля 2024 года

Эта ситуация касается не только Reddit и Microsoft. Вместо этого, она предлагает небольшой взгляд на более широкий дискурс о том, как технологические компании используют публичные данные для своих целей в области ИИ. Комментарий генерального директора Microsoft AI Мустафы Сулеймана о том, что интернет-данные были “бесплатным программным обеспечением”, разжигает дальнейшее обсуждение, подразумевая давно устоявшееся понятие о том, что данные могут использоваться для обучения искусственного интеллекта.

Позиция Хаффмана предполагает изменение восприятия создателей контента в отношении их связи с поисковыми системами и ИИ-компаниями. Старая схема обмена данными на трафик, похоже, меняется. Поскольку жажда данных ИИ растет, условия взаимодействия пересматриваются. Решение Reddit может стать первой инстанцией, мотивирующей дополнительных поставщиков контента и предотвращающей согласие с обходчиками.

Эта продолжающаяся история Reddit против Microsoft важнее, чем просто драматическое разногласие между двумя компаниями. Она представляет собой важный вопрос нашего времени, показывая сложную связь между конфиденциальностью данных, развитием искусственного интеллекта и основополагающими принципами, на которых строится Интернет.