Расследование показывает, что технологические компании обучали ИИ на транскриптах YouTube

Ai Trained Youtube Video Transcripts Featured

Искусственный интеллект не является магическим – это уже в названии: «искусственный». Мы знаем, что контент откуда-то происходит. Расследование показало, что некоторые из крупных технологических компаний, включая Apple, обучали свои технологии ИИ на транскриптах видео с YouTube – все это без разрешения.

Расследование показывает использование транскриптов YouTube

Агентство Proof News провело расследование, в рамках которого был разработан инструмент поиска для анализа данных по YouTube. Расследование установило, что субтитры почти 175 000 видео с YouTube от более чем 48 000 каналов были использованы технологическими компаниями.

Воспользовались видео, включая эпизоды поздних шоу The Late Show with Stephen Colbert и Jimmy Kimmel Live. Также в расследовании представлены видео от MrBeast, PewDiePie и Marques Brownlee.

Ai Trained Yourube Videos How Do Llm Work

Данные были собраны из «The Pile». В 2020 году “The Pile” описывался как смесь из 22 наборов данных от EleutherAI, некоммерческой организации.

Специалист Google в письме CNET заявил, что компания придерживается своих предыдущих заявлений, ссылаясь на комментарий из апреля. Генеральный директор Нил Мохан тогда сказал, что не знает, использовал ли OpenAI видео с YouTube. Но если это так, он признал, что это является нарушением условий использования YouTube.

Откуда еще берется контент ИИ?

Практически каждая технологическая компания недавно заявила, что она разрабатывает или уже разработала систему ИИ. Как уже было сказано, мы знаем, что это не магия и контент откуда-то поступает. Просто не ожидалось, что ИИ будет основан на транскриптах YouTube.

OpenAI, создатели ChatGPT, ранее упоминали, что найти наборы данных для обучения ИИ становится все сложнее, и это привело их к заключению соглашений с Reddit и News Corp. для использования их контента. Google заявила, что у нее есть соглашение с создателями контента, которое позволяет использовать контент YouTube в ее обучении ИИ. В Google Search недавно была добавлена функция AI Overview. Узнайте, как отключить AI Overview, если это вам не интересно.

Ai Trained Yourube Videos Chatgpt

Тем не менее, представитель Anthropic признал агентству Proof News, что они использовали “The Pile” для обучения Claude, своего AI-ассистента. Представитель также подтвердил, что в “The Pile” есть некоторые субтитры YouTube.

Не имеет значения, используете ли вы Claude, ChatGPT или другую технологию ИИ, она была обучена на наборе данных. Вопрос в том, была ли она обучена на контенте от готовых к сотрудничеству поставщиков, таких как Reddit, или же поиск поставщиков расширился до контента, который использовался без ведома создателей. Это определенно то, о чем стоит подумать в следующий раз, когда вы будете использовать AI-чат.