Untersuchung zeigt, dass Technologieunternehmen KI mit YouTube-Transkripten trainiert haben

Ai Trained Youtube Video Transcripts Featured

Künstliche Intelligenz ist nicht magisch – es steht schon im Namen: „künstlich.“ Wir wissen, dass der Inhalt von irgendwoher stammt. Eine Untersuchung zeigte, dass einige der großen Namen in der Technologie, einschließlich Apple, ihre KI-Technologie mit Transkripten von YouTube-Videos trainiert haben – und das alles ohne Erlaubnis.

Untersuchung zeigt Nutzung von YouTube-Transkripten

Proof News führte eine Untersuchung durch, die ein Suchwerkzeug beinhaltete, um nach YouTube in dem Datensatz zu suchen. Die Untersuchung ergab, dass die Untertitel von fast 175.000 YouTube-Videos von mehr als 48.000 Kanälen von Technologieunternehmen genutzt wurden.

Die verwendeten Videos umfassten Late-Night-TV-Episoden von The Late Show with Stephen Colbert und Jimmy Kimmel Live. Auch Videos von MrBeast, PewDiePie und Marques Brownlee wurden in der Untersuchung aufgeführt.

Ai Trained Yourube Videos How Do Llm Work

Der Datensatz stammt aus „the Pile“. Im Jahr 2020 wurde „the Pile“ als Mischmasch aus 22 Datensätzen von EleutherAI beschrieben, einer Non-Profit-Organisation.

Ein Google-Sprecher sagte in einer E-Mail an CNET, dass das Unternehmen zu dem steht, was es zuvor gesagt hat, und verwies auf einen Kommentar aus dem April. CEO Neal Mohan sagte damals, dass er nicht wisse, ob OpenAI YouTube-Videos verwendet hat. Sollte es der Fall gewesen sein, erkannte er an, dass dies einen Verstoß gegen die TOS von YouTube darstellen würde.

Woher kommt sonst der KI-Inhalt?

Fast jedes Technologieunternehmen hat kürzlich angekündigt, ein KI-System zu entwickeln oder entwickelt zu haben. Wie bereits erwähnt, wissen wir, dass es nicht magisch ist und dass der Inhalt irgendwoher stammt. Es war nur nicht zu erwarten, dass die KI aus YouTube-Transkripten stammt.

OpenAI, die Schöpfer von ChatGPT, haben zuvor erwähnt, dass es zunehmend schwierig wird, Datensätze zum Trainieren von KI zu finden, und das führte dazu, dass sie Vereinbarungen mit Reddit und News Corp. für deren Inhalte trafen. Google hat gesagt, dass es eine Vereinbarung mit Inhaltsanbietern hat, die es ihm erlaubt, YouTube-Inhalte in seinem KI-Training zu verwenden. AI Overview wurde kürzlich zur Google-Suche hinzugefügt. Erfahren Sie, wie Sie AI Overview ausschalten können, wenn es Ihnen nicht zusagt.

Ai Trained Yourube Videos Chatgpt

Dennoch erkannte ein Sprecher von Anthropic gegenüber Proof News an, dass sie „the Pile“ verwendet haben, um Claude, ihren KI-Assistenten, zu trainieren. Der Sprecher erkannte auch an, dass es einige YouTube-Untertitel in „the Pile“ gibt.

Ob Sie Claude, ChatGPT oder eine andere KI-Technologie verwenden, sie wurde auf einem Datensatz trainiert. Die Frage ist, ob sie mit freiwilligen Inhaltsanbietern, wie Reddit, trainiert wurde oder ob die Suche nach Anbietern auf Inhalte ausgedehnt wurde, die ohne Wissen der Ersteller verwendet wurden. Es ist definitiv etwas, über das Sie nachdenken sollten, das nächste Mal, wenn Sie einen KI-Chatbot nutzen.

Bildnachweis: Unsplash