Apple Intelligence wurde nicht anhand „gestohlener“ YouTube-Videos trainiert

| 14:45 Uhr | 0 Kommentare

Die Entwicklung von künstlicher Intelligenz (KI) wirft zunehmend Fragen zum Umgang mit Trainingsdaten auf. Nachdem OpenAI bereits aufgrund der Trainingsdaten der Video-KI „Sora“ kritisch beäugt wird, steht nun auch Apple im Mittelpunkt einer Diskussion über die Verwendung möglicherweise urheberrechtlich geschützter Daten für KI-Modelle. Wie 9to5Mac berichtet, hat Apple jetzt Stellung zu Vorwürfen bezüglich der Nutzung einer umstrittenen Datensammlung namens „The Pile“ bezogen.

Kontroverse um „The Pile“

Das Datenjournalismus-Projekt „Proof“ deckte auf, dass die Datensammlung „The Pile“ zahlreiche Inhalte enthält, die ohne explizite Zustimmung der Urheber zusammengetragen wurden. Darunter befinden sich Untertitel von YouTube-Videos, Wikipedia-Artikel und Dokumente des Europäischen Parlaments. Zudem hieß es, dass Apple und andere Tech-Giganten die Datensätze zum Trainieren ihrer KI-Modelle verwendet haben.

Nun hat sich Apple geäußert und erklärt, dass das Unternehmen zwar „The Pile“ verwendet hat, der Datensatz aber nicht für Apple Intelligence eingesetzt wurde. Stattdessen nutzte das Unternehmen die Daten ausschließlich für ein Forschungsprojekt namens „OpenELM“. Dieses quelloffene Sprachmodell wurde speziell für mobile Plattformen entwickelt, jedoch nie kommerziell eingesetzt. Apple hat in der Vergangenheit wiederholt betont, dass die Quellen für seine künstlichen Intelligenzprojekte ethisch vertretbar sind, wobei bekannt ist, dass das Unternehmen Millionenbeträge an Verlage gezahlt und Bilder von Fotobibliotheksfirmen lizenziert hat.

Die Debatte um die Nutzung frei zugänglicher Daten für das KI-Training spaltet Experten. Einige argumentieren, dass öffentlich verfügbare Informationen, ähnlich wie bei menschlichem Lernen, für KI-Systeme genutzt werden dürfen. Andere sehen darin eine mögliche Verletzung von Urheberrechten. Apples offene Kommunikation zu diesem Thema zeigt, dass Technologieunternehmen zunehmend unter Druck stehen und somit wird die Diskussion um KI-Trainingsdaten sicherlich weiter an Bedeutung gewinnen.

Kategorie: Apple

Tags:

0 Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert