netzpolitik.org
Rechenzentren in der EU: Stromfresser sollen uns souverän machen
05. Juni 2026 um 14:31

Rechenzentren in der EU: Stromfresser sollen uns souverän machen

05. Juni 2026 um 14:31

Von: Esther Menhard

Mit einem Paket an Gesetzen will die EU-Kommission digital souveräner werden. Aber das positiv besetzte Label verschleiert eine knallharte Industrie-Agenda: Neue Rechenzentren sollen massig Energie verschlingen. Ein Kommentar.

Dieses Bild ist eine Collage mit einer farbenfrohen japanischen Vintage-Landschaft, die einen Berg, Hügel, Blumen und andere Pflanzen sowie einen kleinen Bach zeigt. In der unteren Bildhälfte sind drei große schwarze Datenserver zu sehen, aus denen eine schwarze Rauchwolke aufsteigt, die die Landschaft teilweise verdeckt. — Generative KI braucht viel Energie und Rechenzentren. (Symbolbild) – CC-BY 4.0: Deborah Lupton

Das Problem verfolgt die Debatte um digitale Souveränität wie ein Schatten: Der Begriff ist nicht definiert. Wer genau sich von wem unabhängiger machen soll, bleibt unklar. Nun will die EU den Ausbau von Rechenzentren als Schritt zu mehr Souveränität verkaufen. Dabei entstehen allerdings neue Abhängigkeiten, und zwar von Energieversorgern.

Am Mittwoch hat Kommissions-Vizepräsidentin Henna Virkkunen das lang erwartete Technological Sovereignty Package präsentiert. Von der Hardware bis zur Software will die Kommission Europa technologisch autonomer und resilienter machen. „Wir können es uns nicht leisten, bei den Technologien, die den Betrieb unserer Krankenhäuser, die Stabilität unserer Energienetze und die Sicherheit unserer Dienste gewährleisten, von anderen abhängig zu sein“, lässt sich Ursula von der Leyen (CDU) zitieren.

Doch die Kommission verfolge eine Definition von digitaler Souveränität, mit der sie „Regulierung und regulatorische Durchsetzungsfähigkeit weitgehend ausblendet“, kritisiert Marielle-Sophie Düh. Sie ist Doktorandin am Centre for Digital Governance der Hertie School und Mitglied der Forschungsgruppe „Politics of Digitalization“ vom Wissenschaftszentrum Berlin für Sozialforschung. Letztlich reduziere die Kommission „Souveränität auf ein industriepolitisches Projekt“.

Energiebedarf: verfünffachen

Daraus macht die Kommission keinen Hehl. Ganz offiziell will sie mit dem Paket „die Wettbewerbsfähigkeit und die geoökonomische Position Europas stärken“, heißt es in einer Zusammenfassung. Hierfür will sie den Weg für mehr Rechenzentren ebnen.

Offenbar waren die Lobby-Bestrebungen von Wirtschaftsverbänden erfolgreich. Im Vorfeld hatte etwa der Verband der Internetwirtschaft eco gewarnt: Europa dürfe „den Ausbau von Rechenzentren nicht durch neue Regulierung selbst ausbremsen“. Dabei ist Deutschland heute schon nach den USA das Land mit den weltweit meisten Rechenzentren.

Nun will die EU-Kommission Genehmigungsverfahren für Rechenzentren unter bestimmten Bedingungen beschleunigen. Wie ein hochrangiger EU-Beamter erklärte, visiert die Kommission mit ihrem Paket an, dass sich der Energiebedarf europäischer Rechenzentren in etwa verfünffachen wird – von zurzeit 12 Gigawatt auf 60 Gigawatt im Jahr 2035.

Damit verschlingen Rechenzentren zunehmend große Teile des Strombedarfs ganzer EU-Länder. Rechenzentren in Irland beanspruchen bereits heute 22 Prozent des dortigen Bedarfs, mehr als ein Fünftel. In Deutschland sind es noch vier Prozent.

Umweltvorschriften: verwässern

Um „den Weg für diese stromfressenden Rechenzentren frei zu machen“, sei die Kommission dazu bereit, „Umweltvorschriften zu verwässern“, kritisiert Bram Vranken. Er ist Forscher und Aktivist beim Corporate Europe Observatory und untersucht die Lobby-Taktiken von Unternehmen wie Meta, Amazon und Google. Dafür werfe die Kommission ihre Klimaziele über den Haufen. So habe Big Tech mithilfe aggressiver Lobbyarbeit den „Plan der Kommission, Mindeststandards für die Nachhaltigkeit von Rechenzentren einzuführen, zum Scheitern gebracht“, so Vranken.

Er warnt: Mit ihrer Wirtschaftspolitik wird die EU „unser aller Stromrechnungen in die Höhe treiben“. In Irland ist das seit mindestens einem Jahr bittere Realität.

KI-Wettlauf: mithalten

Mit den Rechenzentren und ihrem Energiehunger will die EU im weltweiten KI-Wettlauf mithalten. Dafür hat die Kommission schon vor gut einem Jahr den Aktionsplan „Kontinent KI“ aufgestellt, wonach sogenannte Künstliche Intelligenz die Wettbewerbsfähigkeit Europas entscheidend bestimme.

Auch wenn Tech-Konzerne gerne ein anderes Bild vermitteln, verbraucht vor allem generative KI viel Energie und treibt den Bedarf weiter in die Höhe: So erwartet die Internationale Energieagentur, dass der Stromverbrauch aller Rechenzentren weltweit bis 2030 auf rund 945 Terrawattstunden ansteigt. Das wäre doppelt so viel wie im Jahr 2024.

Die Kommission will zwar an der Energieeffizienz schrauben, um den Bedarf an teurer Energie aus fossilen Brennstoffen zu begrenzen und stärker auf erneuerbare Energien zu setzen. Aber in welchem Ausmaß wird das gelingen? In Deutschland geht Wirtschaftsministerin Katherina Reiche (CDU) einen ganz anderen Weg. Die Ex-CEO des Strom- und Gasnetzbetreibers Westenergie bastelt an der Ausschreibung für mehr Kapazität bei Gastkraftwerken: 20 Gigawatt bis 2030.

Für die„AI First“-Mentalität der EU-Kommission ist „digitale Souveränität“ bloß ein Label. Im Zentrum steht der globale Industrie-Wettbewerb – nicht Folgen für Umwelt oder Gesellschaft. Jüngst hat die EU-Kommission den Siemens-Vorstandsvorsitzenden Jim Hagemann Snabe als Berater für industrielle KI eingesetzt. In Brüssel gab es dafür viel Kritik, immerhin hatte sich Snabe dafür eingesetzt, KI-Vorschriften in der EU zu schleifen. Die Folgen der KI-Politik dürften jedoch alle treffen, spätestens bei der Stromrechnung.

Die Arbeit von netzpolitik.org finanziert sich zu fast 100% aus den Spenden unserer Leser:innen.
Werde Teil dieser einzigartigen Community und unterstütze auch Du unseren gemeinwohlorientierten, werbe- und trackingfreien Journalismus jetzt mit einer Spende.

netzpolitik.org
KI-Klimaschwindel und Greenwashing: Big Tech erklärt das Problem zur Lösung
01. Juni 2026 um 18:06

KI-Klimaschwindel und Greenwashing: Big Tech erklärt das Problem zur Lösung

netzpolitik.org

01. Juni 2026 um 18:06

Von: Denis Glismann

Die Beweise für positive Klimaauswirkungen durch sogenannte „KI“ sind schwach, während die Klimaschäden klar belegt sind. Ein Bericht von AlgorithmWatch zeigt, dass die Klima-Versprechen nicht eingelöst werden können. Um das zu verschleiern, vermischen die Unternehmen verschiedene KI-Technologien – und klammern die energiehungrige generative KI dabei aus.

KI-Unternehmen setzen beim Klimawandel die KI-Schwindel-Brille auf. – Alle Rechte vorbehalten: Victoria O’May

Der Ausbau von KI-Rechenzentren führt zu einer steigenden Nachfrage nach fossilen Brennstoffen, denn der Energiehunger von KI-Technologien ist offensichtlich. Die nachweislich negativen Auswirkungen auf das Klima werden von den Technologieunternehmen jedoch heruntergespielt, während sie gleichzeitig in Aussicht stellen, KI könne in der Zukunft helfen, die Probleme des Klimawandels zu bewältigen.

Die Behauptungen von Big Tech beruhen dabei nicht auf glaubwürdigen und belegbaren Daten, sondern auf der Selbstausstellung eines „Blanko-Schecks“, um „die Umwelt unter Verweis auf leere Heilsversprechen weiter zu verschmutzen“. Zu diesem Ergebnis kommt der neue Bericht von AlgorithmWatch: „Der KI-Klimaschwindel: Hinter den Kulissen des Big-Tech-Greenwashings“. Während die negativen Auswirkungen nachweisbar seien sowie immer weiter zunehmen würden, basierten die Lösungsversprechen hauptsächlich auf Wunschdenken mit geringer Faktenbasis.

Der Bericht untersucht systematisch die Stichhaltigkeit der Behauptung eines angeblichen „Netto-Klimanutzens“ durch KI. Aus insgesamt acht Quellen wurden dafür 154 KI-Klimaversprechen extrahiert. Das Ergebnis: 150 Versprechen (97 Prozent) bezogen sich entweder auf die „herkömmliche“ KI, also insbesondere auf Vorhersagemodelle und Computer-Vision, oder generative KI mit einem nur sehr eng begrenzten Anwendungsbereich. Nur vier Behauptungen (drei Prozent) bezogen sich tatsächlich auf klar definierbare generative KI-Anwendungen für Verbraucher:innen (wie Chatbots), die mit großen öffentlich zugänglichen Datensätzen trainiert wurden. Die Klimaauswirkungen generativer KI werden durch verallgemeinerte „KI-Nachhaltigkeitsbehauptungen“ also gezielt verschleiert, indem grundsätzlich verschiedene Technologien gleichgesetzt werden.

„ ‚KI’ ist ein sehr neuer Begriff, auch wenn einige der Technologien schon sehr alt sind“, sagt der Hauptautor des Berichts, Energie- und Klimaanalyst Ketan Joshi, gegenüber netzpolitik.org. „Daher nutzen sie diese Unvertrautheit aus. Indem sie diese beiden Dinge miteinander vermischen und den Wandel als unvermeidlich darstellen, entziehen sie sich jeglicher Verantwortung, auf die schlechten, verschwenderischen und schädlichen Dinge zu verzichten.“

KI ist nicht gleich KI

Der für das Jahr 2030 prognostizierte Energieverbrauch generativer KI-Anwendungen liegt dabei um das Dreizehnfache höher als der Energieverbrauch herkömmlicher KI. Dennoch werde unterschlagen, dass die Klimaschäden durch KI-Nutzung überwiegend durch eben diese generativen KI-Anwendungen entstehen. Die Analyse fand so kein einziges Beispiel einer generativen Consumer-KI, die nachweislich zu einer Emissionsreduktion geführt hätte.

„Wenn es Nachhaltigkeitsvorteile durch künstliche Intelligenz gibt, dann durch Anwendungen traditioneller KI mit wenig Ressourcenverbrauch. Die großen sprach- und bildgenerierenden Modelle wie ChatGPT […] verbrauchen Unmengen an Strom und Wasser, verursachen CO₂-Emissionen in der Höhe ganzer Länder, bringen aber keinerlei positiven Nutzen für die Umwelt“, sagt Senior Policy Manager bei AlgorithmWatch, Julian Bothe, gegenüber netzpolitik.org.

Ferner stützen sich laut der Analyse des Reports nur 26 Prozent der 154 untersuchten KI-Klimaversprechen auf tatsächlich wissenschaftliche Studien. 36 Prozent führten keinerlei Belege an, während der Rest überwiegend auf die Unternehmensberichte und Unternehmenswebseiten verwies. Hinzu kämen Verweise auf Medien, sonstige Institutionen oder unveröffentlichte Studien.

Viel Behauptung, kaum Beleg

Ein besonders prägnantes Beispiel sei Google: Der Konzern wirbt seit Jahren damit, KI könne bis 2030 fünf bis zehn Prozent der weltweiten Treibhausgasemissionen einsparen. Dies entspräche dem gesamten Jahresausstoß der Europäischen Union. Die Quelle dieser Statistik hält allerdings keiner Überprüfung stand: Diese ist nämlich der Blogbeitrag eines Beratungsunternehmens aus dem Jahr 2021, das diese Einschätzung offenbar aus der eigenen „Kundenerfahrung“ entnommen hatte. Dennoch tauchte die Behauptung noch im April 2025 in einer Policy-Roadmap von Google auf, die auf die EU zielte – und zwar unter dem Verweis auf „Studien“.

Einige der Zahlen stammen jedoch nicht unmittelbar aus der Unternehmens-PR und tragen ein wissenschaftliches Etikett. Eine Analyse des Ökonomen Nicholas Stern, veröffentlicht in einem Nature-Fachjournal, kommt zu dem Schluss, KI werde die weltweiten Emissionen bis 2035 um 36 Prozent senken. Amy Luers, Head of Sustainability Science and Innovation bei Microsoft, beziffert das Einsparpotenzial in einem Kommentar in Nature auf 1,4 Gigatonnen jährlich. Auch der einflussreiche IEA-Bericht „Energy and AI“ vom April 2025, dessen Entwurf unter anderem von Beschäftigten von Amazon, Google, Nvidia, Meta und Microsoft begutachtet wurde, kommt zu dem Ergebnis, dass KI unter bestimmten Bedingungen Netto-Emissionen einsparen könnte. Der AlgorithmWatch-Bericht hält solche Rechnungen jedoch für fragwürdig, weil sie auf schwach begründeten Beispielen aufbauen. „Es hat mich überrascht, solche Behauptungen in Nature zu sehen“, sagt Joshi. Viele wissenschaftliche Publikationen seien beim KI-Thema enthusiastisch und „womöglich nicht im Einklang mit dem, was wir über die Umweltschäden wissen“.

Ein weiteres Beispiel für irreführende Behauptungen sei auch die der Internationalen Energieagentur, dass das Kreuzfahrtunternehmen Carnival Cruise Lines dank KI seinen Treibstoffverbrauch erheblich gesenkt habe, so Joshi gegenüber netzpolitik.org. „Es scheint wahrscheinlich, dass der Verweis auf der Website größtenteils mithilfe von KI generiert wurde – oder dass es sich zumindest um eine schwache Quelle handelt, die keinen Bezug zu den tatsächlichen Berichten des Unternehmens aufweist.“ Dies verdeutliche laut Joshi, wie das Potenzial von KI nicht nur überbewertet wird, sondern auch, wie KI selbst das Informationsumfeld zerstöre.

Neue Form des Greenwashings

Rechenzentren verbrauchten 2024 rund 1,5 Prozent des weltweiten Stroms, bis 2030 erwartet die IEA eine Verdopplung. Die großen Tech-Konzerne verfehlen ihre eigenen Klimaziele und an den Standorten von Meta, OpenAI und xAI entstehen neue Gaskraftwerke. Der Bericht sieht so eine neue Greenwashing-Strategie. Emissionsintensive Industrien versuchen seit jeher ihre angerichteten Schäden kosmetisch „auszugleichen“, beispielsweise mit betrugsanfälligen Klimazertifikaten. Neu sei hingegen, dass unterschiedliche Technologien unter dem Überbegriff „KI“ zusammengefasst werden, um der Verantwortung für den Ausbau energiehungriger generativer KI zu entgehen.

Tatsächlich gibt es laut Bericht keinerlei glaubwürdige Grundlage für die Aussage, die klimafreundlichen Auswirkungen von Künstlicher Intelligenz würden die schädlichen Folgen der Technologie wieder ausgleichen können. Der Bericht behauptet gleichwohl nicht, dass KI keinerlei Klimanutzen haben könne. Unbelegt sei jedoch das Narrativ, KI könne Schäden im Gigatonnen-Bereich ausgleichen. Statt mit vagen Begriffen und schwachen Belegen die Klimaschäden zu verschleiern, läge die Verantwortung, in echte Nachhaltigkeit zu investieren, weiterhin bei den Big-Tech-Konzernen.

„Wenn es Google, Microsoft und Co. ernst wäre mit ihrer Sorge um die Umwelt, würden sie die Auswirkungen ihrer KI-Technologien offenlegen und auch die tatsächlichen Verbräuche der dafür genutzten Rechenzentren transparent veröffentlichen“, findet Bothe. „Tatsächlich passiert das Gegenteil: Die großen Tech-Unternehmen tun alles dafür, um sich sogar der gesetzlich geregelten Veröffentlichungspflichten zu entledigen – und die Regierungen auf EU- und Bundesebene knicken vor den Forderungen der Tech-Giganten ein.“

Die Arbeit von netzpolitik.org finanziert sich zu fast 100% aus den Spenden unserer Leser:innen.
Werde Teil dieser einzigartigen Community und unterstütze auch Du unseren gemeinwohlorientierten, werbe- und trackingfreien Journalismus jetzt mit einer Spende.

netzpolitik.org
Für 250 Millionen Euro: Bund schafft neue Abhängigkeiten von IT-Konzernen
27. Mai 2026 um 08:59

Für 250 Millionen Euro: Bund schafft neue Abhängigkeiten von IT-Konzernen

netzpolitik.org

27. Mai 2026 um 08:59

Von: Esther Menhard

Für eine dreistellige Millionensumme sollen SAP und Telekom eine „KI-Cloud“ für die öffentliche Verwaltung bauen. Digitalminister Karsten Wildberger nennt das souverän. Unabhängig wird Deutschlands Verwaltung damit nicht, warnen Opposition und Fachleute.

Karsten Wildberger auf der Bühne der re:publica 2026 — Karsten Wildberger freut sich auf die KI-Cloud für die Verwaltung. (Symbolbild) – Alle Rechte vorbehalten: IMAGO / dts Nachrichtenagentur

Für 250 Millionen Euro sollen deutsche Konzerne IT-Infrastruktur für die öffentliche Verwaltung aufbauen. Im Mittelpunkt steht eine „KI-Cloud“. Das sind Server, auf denen KI-Software laufen soll.

Damit setzt Digitalminister Karsten Wildberger (CDU) seinen KI-freundlichen Kurs fort. Zuletzt hatte er den Agentic AI Hub gestartet. Sogenannte KI-Agenten sollen Beamt*innen zum Beispiel dabei helfen, Dokumente auf Vollständigkeit zu prüfen. Im Gegensatz zu Sprachmodellen wie ChatGPT geben KI-Agenten nicht nur Antworten, sondern erfüllen Aufgaben mit digitalen Werkzeugen.

Die neue „KI-Cloud“ soll nun „zur zentralen Schaltstelle für die öffentliche Verwaltung werden“, erklärt das Digitalministerium. Zunächst soll die KI-Plattform KIPITZ dorthin umziehen. Die Cloud sei das „Rückgrat einer souveränen, digitalen und KI-fähigen Verwaltung“, sagt der Digitalminister. Die dafür veranschlagten 250 Millionen Euro will sein Ministerium an zwei Konsortien verteilen: 70 Prozent erhalten die Telekom-Tochter T‑Systems und SAP; weitere 30 Prozent ein Konsortium um den Wiesbadener IT-Dienstleister SVA.

Wie die Deutsche Presse-Agentur berichtet, sei der Auftrag „bewusst zweigeteilt“ worden, um die Abhängigkeit von nur einem Anbieter zu umgehen. Wildberger sprach von einer „Infrastruktur, die wir selbst kontrollieren“. Telekom-Chef Tim Höttges sagte: „Zusammen sorgen wir dafür, dass Deutschland und Europa die digitale Zukunft selbst in der Hand haben.“ Das soll unter anderem mit SAPs „Business AI Platform“ geschehen. SAP-Chef Christian Klein zeigte sich zufrieden, dass seine KI-Cloud „Teil des Deutschland-Stacks“ werden soll.

Bund zahlt hunderte Millionen für Lizenzen

SAP profitiert bereits in großem Stil von Steuergeldern: Allein im Haushaltsjahr 2025 überwies der Bund an das deutsche Softwareunternehmen 110 Millionen Euro für Lizenzen und weitere 71 Millionen Euro für Produkte und Dienstleistungen. Das zeigt die Antwort der Bundesregierung auf eine Schriftliche Frage von Sonja Lemke von der Linksfraktion, die netzpolitik.org vorliegt.

Zum Vergleich: Im selben Jahr hat der Bund 481 Millionen Euro für Microsoft-Lizenzen ausgegeben. Die Kosten sind im Vergleich zu den beiden Vorjahren stetig gestiegen: 2023 waren es noch rund 274 Millionen Euro, ein Jahr später bereits rund 348 Millionen.

Nicht nur Lizenzen großer US-Unternehmen sind „ein wahnsinniger Kostenfaktor“, kommentiert die Abgeordnete gegenüber netzpolitik.org.

Warnung vor Lock-in-Effekt

Die Projekte aus dem Digitalministerium zeigen: Künftig könnte vermehrt Geld an deutsche oder europäische Konzerne fließen. Das entspricht dem Tenor aus dem Gipfel zur europäischen digitalen Souveränität im November: „buy european“, kauft in Europa ein. Kritik daran gibt es von der Opposition und von Fachleuten. Sie warnen vor neuen Abhängigkeiten durch andere Konzerne.

So kritisiert Linken-Abgeordnete Lemke: US-Konzerne hätten kein Patent darauf, Kunden von sich abhängig zu machen. Sie warnt vor dem Lock-in-Effekt – also davor, dass die Verwaltung von einem einmal gewählten Anbieter nicht mehr loskommt. Dieser Effekt richtet sich nicht danach, wo ein Unternehmen sitzt, sondern danach, wie das IT-Produkt gestaltet ist. „Wer einmal SAP nutzt, kann die eigenen Daten nicht mehr einfach zu einem anderen Anbieter umziehen“, warnt Lemke.

Deshalb fordert sie ein Umdenken: „Digitalisierung muss endlich heißen, eigene Infrastrukturen aufzubauen.“ Dafür brauche es eigene Rechenzentren sowie eigene Betriebssysteme und Software, über die die öffentliche Hand selbst verfügen kann. Die Verwaltung brauche mehr IT-Kompetenz, um weniger von externen Beraterfirmen abhängig zu sein.

Ähnlich argumentiert die Free Software Foundation Europe. Mit Blick auf die Debatte um digitale Souveränität in Deutschland pocht der gemeinnützige Verein auf das Credo „Public Money, Public Code“.

Dahinter steht der Gedanke: Wenn Bürger*innen mit ihren Steuern eine Software zahlen, dann sollte sie allen gehören und öffentlich einsehbar sein. „Nur so lässt sich die strukturelle Abhängigkeit öffentlicher Verwaltungen von proprietärer Software und ihren Herstellern beenden und technologische Souveränität erreichen.“

Die Arbeit von netzpolitik.org finanziert sich zu fast 100% aus den Spenden unserer Leser:innen.
Werde Teil dieser einzigartigen Community und unterstütze auch Du unseren gemeinwohlorientierten, werbe- und trackingfreien Journalismus jetzt mit einer Spende.

netzpolitik.org
ChatGPT: Polizeigewerkschaft bebildert Pressemitteilung mit generiertem Schockerfoto
28. Januar 2026 um 17:41

ChatGPT: Polizeigewerkschaft bebildert Pressemitteilung mit generiertem Schockerfoto

netzpolitik.org

28. Januar 2026 um 17:41

Von: Markus Reuter

Der sächsische Landesverband der Gewerkschaft der Polizei nutzt ein KI-generiertes Bild mit einem blutenden Polizisten, um eine Pressemitteilung zu illustrieren. Begründet wird dies mit Persönlichkeitsrechten und laufenden Ermittlungen, das Bild sei eine „symbolische Illustration“.

Verpixeltes Bild der Polizeigewerkschaft — Wieviel sind Bilder wert, wenn sie nicht die Realität zeigen? Das Bild hier ist eine verpixelte Version des generierten Bildes der Polizeigewerkschaft. – Public Domain CVatGPT / GdP Sachsen / netzpolitik.org

Beim einem Zweitligaspiel der Fußball-Männerteams des 1. FC Magdeburg und Dynamo Dresden am vergangenen Samstag gab es Ausschreitungen. Nach Polizeiangaben soll es 70 verletzte Polizisten gegeben haben. Der sächsische Landesverband der Gewerkschaft der Polizei (GdP) gab dazu eine Pressemitteilung heraus und bebilderte sie mit einem KI-generierten fotorealistischen Bild. Darauf zu sehen: ein blutender Polizist, der von zwei Kollegen gestützt wird.

Dieses Bild war klein mit dem Hinweis „KI: ChatGPT“ gekennzeichnet, erweckt aber auf den ersten Blick den Eindruck, dass dies ein echtes Bild sei. In sozialen Medien sorgte die Bebilderung für Empörung. So kritisierte der Forscher Daniel Mullis auf Bluesky: „Es ist das erste Mal, dass ich solche Bilder von seriösen Stellen sehe, die Ereignisse so darstellen, dass sie besser ins eigene Bild passen.“ Das sei nicht gut, der Deutsche Gewerkschaftsbund, in dem die Gewerkschaft Mitglied ist, dürfe hier nicht schweigen.

Polizeigewerkschaft: „Symbolische Illustration“

Auf Nachfrage, warum die Gewerkschaft hier ein solches Bild einsetze, hat der GdP-Landesvorsitzende Jan Krumlovsky netzpolitik.org geantwortet, dass das KI-generierte Bild als „symbolische Illustration“ eingesetzt worden sei. „Diese Entscheidung erfolgte bewusst, um auf das Thema Gewalt gegen Einsatzkräfte im Zusammenhang mit dem Fußballspiel aufmerksam zu machen, ohne reale Einsatzkräfte, Beteiligte oder konkrete Einsatzsituationen abzubilden“, so Krumlovsky weiter. Als Begründungen nennt der Polizeigewerkschafter den Schutz von Persönlichkeitsrechten, laufende Ermittlungen sowie den respektvollen Umgang mit betroffenen Kolleginnen und Kollegen.

Screenshot der Webseite — So präsentiert die GdP ihre Pressemitteilung - Screenshot GdP Sachsen

Krumlovsky betont, dass das Bild als KI-generiert gekennzeichnet ist. „Es sollte keine dokumentarische Abbildung eines realen Ereignisses darstellen, sondern der thematischen Einordnung dienen“, so der Gewerkschafter weiter. Für die Gewerkschaft sei entscheidend, dass der Einsatz von Illustrationen – unabhängig davon, ob sie KI-generiert oder auf andere Weise erstellt sind – transparent erfolge und keinen dokumentarischen Anspruch erheben würde.

DJV: „Immer ein Grund, hellhörig zu werden“

Unabhängig davon würde die GdP Sachsen die internen Abläufe im Umgang mit KI-generierten Inhalten „weiter präzisieren“, insbesondere bezüglich Kennzeichnung und Kontextualisierung. Nach unserer Presseanfrage hat die Polizeigewerkschaft noch einen weiteren Hinweis auf das generierte Foto unter dem Text angebracht und expliziter in der Quellenangabe den Zusatz „KI-generiert“ ergänzt. Das Bild selbst nutzt sie weiter.

Alles netzpolitisch Relevante

Drei Mal pro Woche als Newsletter in deiner Inbox.

Jetzt abonnieren

Der Bundesvorsitzende des Deutschen Journalisten-Verbands Mika Beuster kommentiert gegenüber netzpolitik.org: „KI-Fotos sind immer ein Grund, hellhörig zu werden.“ Journalist:innen, aber auch die Öffentlichkeit, sollten sich immer kritisch fragen, warum auf KI-Material zurückgegriffen wird, so Beuster weiter. Der Verband spreche sich zudem bei der Nutzung von KI-generierten Bildern für größtmögliche Transparenz aus.

Der Fotojournalist Kai Schwerdt kritisierte bei Bluesky: „Auch wenn das Bild als KI-generiert gekennzeichnet ist, finde ich es bedenklich, wenn die Gewerkschaft der Polizei (GdP) solche Bilder zu dramaturgischen Zwecken einsetzt. Es ist eine bewusste Abkehr von der Realität. Als wäre die nicht schon übel genug.“

Update 29.1.26:
Die GdP Sachsen hat das Bild ausgetauscht.

Die Arbeit von netzpolitik.org finanziert sich zu fast 100% aus den Spenden unserer Leser:innen.
Werde Teil dieser einzigartigen Community und unterstütze auch Du unseren gemeinwohlorientierten, werbe- und trackingfreien Journalismus jetzt mit einer Spende.

netzpolitik.org
Erfundene Quellen: Wie Chatbots die Wikipedia vergiften
29. Dezember 2025 um 18:37

Erfundene Quellen: Wie Chatbots die Wikipedia vergiften

netzpolitik.org

29. Dezember 2025 um 18:37

Von: Leonhard Pitz

Manche Nutzer:innen lassen sich Wikipedia-Artikel von Sprachmodellen generieren, inklusive erfundener Referenzen. Ein Wikipedia-Urgestein stolperte zufällig über die halluzinierten Artikel – ausgerechnet mit der Hilfe von einem Sprachmodell.

Auf der Suche nach nicht existierenden Büchern. (Symbolbild) – Alle Rechte vorbehalten IMAGO / Zoonar

Eigentlich wollte Mathias Schindler nur eine kleine Sache in der Wikipedia korrigieren. Doch dann baute der Wikipedianer versehentlich einen Detektor für bestimmte KI-generierte Inhalte in der Enzyklopädie. Auf dem 39C3 berichtet er, warum die halluzinierten Texte auch ein Problem für die Anbieter großer Sprachmodelle werden könnte und warum er den Autor:innen keine guten Absichten unterstellt.

Die kleine Sache, die Schindler korrigieren wollte, waren fehlerhafte ISBNs. Mit diesen 10 oder 13-stelligen Nummern werden Bücher identifiziert und finden sich oft in Quellenangaben von Wikipedia-Einträgen. Dabei sind die Zahlenkombinationen nicht vollkommen zufällig, erklärt Schindler im Talk. Die letzte Ziffer ist eine Prüfziffer, sie lässt sich aus den neun beziehungsweise zwölf vorherigen Ziffern berechnen. Ursprünglich wollte Schindler falsche ISBNs in der Wikipedia aufspüren und ausbessern, auch damit Nutzer:innen die richtigen Bücher finden, die als Referenzen in den Artikeln angegeben wurden.

Zufallsfund dank falscher ISBNs

„Referenzen auf Wikipedia sind nicht nur wichtig, sondern ein integraler Teil der Wikipedia“, sagt Schindler und verweist in seinem Vortrag auf den alten Spruch: „Wikimedia mag ein guter Ort sein, um eine Recherche zu starten, aber es ist ein schlechter Ort, um dort die Recherche zu beenden.“ (Alle Zitate aus dem Talk haben wir ins Deutsche übersetzt.) Schindler muss es wissen. Er ist Mitbegründer von Wikimedia Deutschland und Wikipedia-Autor seit 2003.

Um die inkorrekten ISBNs zu finden, schrieb Schindler ein Skript, lud die gesamte deutschsprachige Wikipedia herunter und durchsuchte sie nach ISBNs mit einer faulen Prüfziffer, erzählt er in seinem Vortrag. Doch er stieß nicht nur auf falsch eingegebene ISBNs oder von den Verlagen falsch ausgegebene ISBNs, sondern fand auch Artikel, bei denen zwei oder mehr Bücher fehlerhafte ISBNs hatten. Diese Bücher schienen zwar plausible Titel und Autor:innen zu haben, aber Schindler konnte sie nirgendwo sonst finden. Sie waren halluziniert.

Offenbar hatten sich Menschen ganze Artikel von einem Large Language Model (LLM) wie ChatGPT schreiben lassen, welches sich dann auch einen Abschnitt mit Einzelnachweisen ausdachte.

Noch ist es ein Nischenphänomen

Im Gespräch mit netzpolitik.org erzählt Schindler, dass er mit seiner Methode etwa 150 Artikel gefunden habe, bei denen man Sorge haben müsse, dass sie zumindest teilweise KI-generiert und frei erfunden seien. Allerdings seien die fehlerhaften Einträge nicht ausschließlich auf KI-Chatbots zurückzuführen, manchmal gebe es andere Gründe für mehrfach falsche ISBNs, sagt Schindler. Außerdem gibt es über drei Millionen deutschsprachige Wikipedia-Artikel, die 150 Auffälligen machen also nur ein äußerst geringen Anteil von 0,005 Prozent aus.

Andererseits erfasst Schindlers Methode auch nicht alle Halluzinationen, dafür war es schließlich nicht gedacht. „Dieses Werkzeug ist nicht das Universaltool zum Erkennen von ChatGPT-generierten Artikeln.“ Andere Möglichkeiten, solche Inhalte zu enttarnen, seien etwa systematische Abweichungen von der Syntax von „Media Wiki“ (der Software hinter Wikipedia). Oder wenn Autor:innen viele Adjektive verwenden: „Kein Wikipedianer, der was auf sich hält, wird den Fernsehturm als ‚großartig‘ oder ‚herausragend‘ bezeichnen.“

LLM generierter Text „Anti-These zu Wikipedia“

Doch auch wenn das Erstellen von Wikipedia-Artikeln mit LLMs noch nicht so verbreitet sein sollte, geht es für Wikipedia um Grundsätzliches: Die Kontamination mit Inhalten, die auf den ersten Blick wahr erscheinen könnten und sich als Fakten tarnen. Schindler sagt: „Man könnte es auch als Anti-These zu einem Enzyklopädie-Projekt wie Wikipedia beschreiben.“

Die Gefahren? Zum einen können sich falsche Infos verselbstständigen, wenn eine andere Veröffentlichung den vermeintlichen Fakt von Wikipedia abschreibt und die Wikipedia diese Veröffentlichungen hinterher als Beleg für genau diesen Fakt aufführen. Schindler weist in seinem Vortrag auf diesen Teufelskreis hin, der bereits vor LLMs ein Problem darstellte.

Glaubwürdigkeit in Gefahr – und die Qualität von LLMs

Zum anderen verschlingen LLM-generierte Quellen zunehmend die Ressourcen unterschiedlichster Einrichtungen. Nicht nur die der Online-Enzyklopädie: Irregeleitete Nutzer:innen fragen etwa Bibliothekar:innen nach ausgedachten Büchern, berichtete 404 Media im Herbst. Beim Internationalen Komitee des Roten Kreuzes (ICRC) wurde die Situation offenbar so schlimm, dass es sich mit einer „wichtigen Mitteilung“ an die Öffentlichkeit wandte.

„Wenn eine Referenz nicht gefunden werden kann, heißt das nicht, dass das ICRC Informationen zurückhält. Verschiedene Situationen können das erklären, wie etwa unvollständige Zitationen, Dokumente, die in andere Institutionen lagern, oder – zunehmend – KI-generierte Halluzinationen“, warnte das ICRC Anfang Dezember.

Auch für die Entwickler von Large Language Models hätten halluzinierte Wikipedia-Artikel Nachteile, argumentiert Schindler. Denn ihre Modelle werden oft mit Wikipedia-Artikeln trainiert. „Die KI-Firmen profitieren von hochwertigen Daten und leiden unter dem Verlust von Quellen, die frei von synthetischen Texten sind“, sagt im Schindler im Gespräch mit netzpolitik.org. Oder wie er es im Vortrag formuliert: „LLM-Provider vergiften damit auf eine Art den Fluss, aus dem sie selber trinken“, sagt Schindler.

Wer macht sowas?

Doch wer stellt eigentlich LLM-generierte Inhalte in die Wikipedia? „Bunt gemischt“, erzählt Mathias Schindler im Gespräch mit netzpolitik.org. Von Wikipedia-Neulingen über langjährige Autor:innen bis zu einer Werbeagentur sei alles dabei gewesen. Er habe versucht, möglichst viele Autor:innen von verdächtigen Artikeln zu kontaktieren. Manche hätten ihn ignoriert, andere alles geleugnet oder den Einsatz einer LLM heruntergespielt.

„Eine Erklärung ist, dass Menschen LLMs tatsächlich als Recherchewerkzeug ansehen, das magischen Zugang zu wissenschaftlichen Datenbanken und Literatur hat und belastbare Belege liefert“, sagt Schindler zu netzpolitik.org. Bisher habe er aber noch keine solche Person unter den verdächtigen Autor:innen getroffen. Stattdessen vermutet Schindler eher persönlichen Geltungsdrang oder dass Personen eine Agenda verfolgen, die Enzyklopädie in ihrem Sinne umzuschreiben.

In seinem Vortrag erzählt Schindler, er habe alle verdächtigen Autor:innen, um den Prompt gebeten, mit dem diese den Artikel generiert hätten. „Das ist mein persönlicher ‚Litmus‘-Test, ob die Menschen ehrliche Absichten haben“, sagt Schindler. Nur eine einzige Person habe den Prompt nach vielen Nachfragen privat geteilt.

Die Herausforderung bleibt

Laut Schindler wurden alle gemeldeten Artikel gelöscht, bei denen die Autor:innen die Zweifel nicht ausräumen konnten, dass sie KI-generiert waren. In vielen Fällen wurden auch die Autor:innen gesperrt. In einem Richtlinien-Artikel der deutschsprachigen Wikipedia heißt es dazu: „Sprach-KI sind derzeit nicht in der Lage, korrekt belegte Beiträge zu erstellen. Beiträge, die damit erstellt werden, verstoßen daher unter anderem gegen WP:Keine Theoriefindung, WP:Belege, WP:Urheberrechtsverletzung, WP:Neutraler Standpunkt; ihre Verwendung ist daher derzeit generell unerwünscht.“

Für Schindler bleibt es eine Herausforderung für die Wikipedia-Community, halluzinierte Texte aufzudecken, zumal Chatbots künftig ISBNs mit einer korrekt berechneten letzten Stelle erfinden könnten. Er hofft auf einen konstruktiven Dialog mit den KI-Firmen. „Mein persönlicher Wunsch wäre, dass man durch Austausch und vielleicht Kompetenztransfer mit den KI-Firmen erreicht, dass man KI-generierte Texte leichter erkennt, wenn jemand versucht, sie in die Wikipedia zu stellen.“

Am Ende ist die Geschichte der KI-generierten ISBNs auch eine über falschen und vielleicht besseren KI-Einsatz. Denn den Code für seinen ISBN-Checker hat Schindler auch mithilfe von Large Language Models geschrieben.

Die Arbeit von netzpolitik.org finanziert sich zu fast 100% aus den Spenden unserer Leser:innen.
Werde Teil dieser einzigartigen Community und unterstütze auch Du unseren gemeinwohlorientierten, werbe- und trackingfreien Journalismus jetzt mit einer Spende.

netzpolitik.org
Opt-Out-Anleitung: So verhinderst du, dass LinkedIn mit deinen Daten KI trainiert
22. September 2025 um 16:26

Opt-Out-Anleitung: So verhinderst du, dass LinkedIn mit deinen Daten KI trainiert

netzpolitik.org

22. September 2025 um 16:26

Von: Martin Schwarzbeck

Das Karrierenetzwerk LinkedIn will mit Nutzer*innendaten generative KI-Werkzeuge trainieren. Wir zeigen, wie man das dem Unternehmen verbieten kann.

Auf einem Telefon ist die LinkedIn-App angezeigt. — Die Erlaubnis zum KI-Training ist bei LinkedIn voreingestellt. – Alle Rechte vorbehalten IMAGO / Zoonar

Was steht im Lebenslauf, wer postet was, wer sucht schon wie lange einen Job? Die Social-Media-Plattform LinkedIn hat sehr aufschlussreiche Informationen über ihre Nutzer*innen. Normalerweise lässt sich einstellen, wer was sehen darf, aber eine Nutzerin bekommt demnächst Zugang zu vielen vorhandenen Datensätzen: die hauseigene Künstliche Intelligenz, die automatisiert Inhalte erstellen soll. Die wird ab dem 3. November mit Informationen der Nutzer*innen gefüttert.

Nicht zu diesen Informationen gehören laut einer Infoseite private Nachrichten oder Inhalte von minderjährigen Nutzenden. Wer volljährig ist und das KI-Training deaktivieren möchte, muss jetzt tätig werden. Dem Unternehmen diese Verwendung der eigenen Daten zu verbieten, geht so: Wer sich mit einem Browser in seinen Account einloggt, findet auf der Profilseite ganz unten den Link zu „Konto und Datenschutz verwalten“. Dort, in den Profileinstellungen, gibt es den Reiter „Datenschutz“ und unter „So verwendet LinkedIn Ihre Daten“ die Einstellung „Daten zur Verbesserung generativer KI“. Die ist standardmäßig auf „Ein“ gestellt, lässt sich aber mit einem Klick deaktivieren.

Noch mehr Wege, persönliche Informationen vor LinkedIn zu schützen

Die KI soll etwa Arbeitgeber*innen dabei unterstützen, mit Job-Kandidat*innen in Kontakt zu kommen und Nutzer*innen bei Profilaktualisierungen, Nachrichten und Beiträgen helfen. Sie lässt sich auch verwenden, wenn man LinkedIn die Erlaubnis zur Datennutzung zum KI-Training eintzogen hat.

LinkedIn beruft sich bei dem KI-Training auf ein berechtigtes Interesse nach DSGVO. Bei bestimmten Änderungen der Nutzungsbedingungen, beispielsweise wenn ein neues Produkt eingeführt wird, will LinkedIn die Nutzer*innen künftig nicht mehr vorab über die Änderung informieren. Gleichzeitig verkündete das Unternehmen auch, dass es zu Werbezwecken künftig mehr Daten an die Muttergesellschaft Microsoft weitergeben will. Unter dem Reiter „Anzeigendaten“ in den Profileinstellungen lässt sich angesichts verschiedener Datenarten festlegen, dass LinkedIn diese künftig nicht mehr zum Ausspielen personalisierter Werbung nutzen darf.

Die Arbeit von netzpolitik.org finanziert sich zu fast 100% aus den Spenden unserer Leser:innen.
Werde Teil dieser einzigartigen Community und unterstütze auch Du unseren gemeinwohlorientierten, werbe- und trackingfreien Journalismus jetzt mit einer Spende.

🏷️ Meine Labels
- ❌
❌
Hashtags
22. September 2025 um 16:26

netzpolitik.org
Datenschutz und KI: Schluss mit der Zögerlichkeit!
17. September 2025 um 15:43

Datenschutz und KI: Schluss mit der Zögerlichkeit!

netzpolitik.org

17. September 2025 um 15:43

Von: Gastbeitrag · Paulina Jo Pesch

Die Folgen des KI-Hypes für den Datenschutz sind schwer absehbar. Im Fall von Metas KI-Training zögern Aufsichtsbehörden, das Oberlandesgericht Köln gab dem Konzern sogar – fürs Erste – grünes Licht. Jura-Professorin Paulina Jo Pesch zeigt Schwächen des Urteils auf und fordert eine entschiedenere Durchsetzung der Datenschutzvorgaben.

Ein altmodisch aussehendes Treppenhaus von oben. Es windet sich in Spiralen nach unten. — Abwärtsspirale: Das Treppenhaus im Oberlandesgericht Köln – CC-BY-SA 4.0 1971markus

Hinter weitverbreiteten KI-Anwendungen stehen generative Sprach- und Bildmodelle, die mit riesigen Datenmengen gefüttert werden, auch mit personenbezogenen Daten. Das Problem: Teile der Trainingsdaten, darunter personenbezogene, lassen sich aus vielen der Modelle extrahieren. Unter welchen Umständen sich ein Modell zu viel „merkt“ und wie sich das verhindern lässt, ist bislang wenig erforscht. Zugleich werden Extrahierungsmethoden immer besser. Anbieter*innen können bislang nicht verhindern, dass Modelle personenbezogene Trainingsdaten ausgeben. Auch Chatbots können personenbezogene Daten von anderen verraten.

Außerdem „halluzinieren“ die Modelle. Sie generieren also falsche Informationen, die nicht in den Trainingsdaten enthalten sind. Weil KI-Unternehmen diese nicht offenlegen, können Forscher*innen nicht zuverlässig messen, wann ein Modell Informationen erfindet und wann es unrichtige Trainingsdaten wiedergibt. Zuverlässige Methoden zur Vermeidung von Halluzinationen gibt es bisher nicht.

Werden personenbezogene Daten aus einem Modell extrahiert, kann für Betroffene gerade die Kombination aus „Erinnerung“ und „Halluzination“ gefährlich sein. Ein mit personenbezogenen Daten trainiertes Modell generiert unter Umständen Falschinformationen über sie. Gerade bei öffentlichen Modellen besteht das Risiko, dass Nutzer*innen diese Informationen unkritisch weiterverbreiten.

Meta fragt lieber nicht um Erlaubnis

Mit Llama (Large Language Model Meta AI) ist auch Meta an dem KI-Rennen beteiligt. Meta nutzt Llama für eigene KI-Funktionen wie Transkriptions- oder Suchfeatures auf Instagram, Facebook und WhatsApp sowie für Chatbots oder in KI-Brillen, die das Unternehmen anbietet. Außerdem stellt Meta seine Modelle anderen zur Nutzung bereit. So können etwa Forscher*innen die Modelle testen oder Unternehmen auf Basis von Llama KI-Dienstleistungen oder -Produkte anbieten.

Im Juni 2024 informierte Meta die Nutzer*innen von Instagram und Facebook über eine Aktualisierung seiner Datenschutzrichtlinie. Diese Aktualisierung ließ Metas Vorhaben erkennen, seine KI-Modelle mit Nutzer*innendaten zu trainieren. Die Nutzer*innen konnten dem zwar widersprechen, die Widerspruchsmöglichkeit war jedoch schwer auffindbar.

Nachdem Datenschutzorganisationen wie noyb Meta scharf kritisierten, veröffentlichte der Konzern noch gleichen Monat weitere Informationen zum geplanten Training. Demnach beabsichtigte der Konzern, nur noch öffentliche Daten für das Training zu verwenden. Kurz darauf verkündete Meta, die irische Datenschutzbehörde verzögere das Training in der EU. Im April 2025 verkündete der Konzern dann den baldigen Trainingsstart.

Was trainiert Meta eigentlich mit welchen Daten?

Inzwischen hat der Konzern damit begonnen, seine KI mit den Daten europäischer Nutzer*innen zu trainieren. Unklar ist weiterhin, welche Daten dafür genau genutzt werden. Meta stellt im Vergleich zu anderen KI-Unternehmen zwar mehr Informationen über das Training mit Social-Media-Daten bereit. Diese Informationen haben sich aber immer wieder verändert und lassen Fragen offen.

Das betrifft insbesondere den Umgang mit sensiblen Daten. Bei Llama handelt es sich um ein multimodales Sprachmodell, das neben Texten auch Bilder, Videos und Tondateien verarbeitet. Der für das Training genutzte Social-Media-Content umfasst damit etwa auch Fotos der Nutzer*innen. Metas Datenschutzinformationen verweisen auf öffentliche Inhalte wie Beiträge, Kommentare und Audiospuren.

Inzwischen heißt es in den Datenschutzinformationen, dass auch Daten von Drittpartner*innen und KI-Interaktionen für die KI-Entwicklung genutzt würden. Als Beispiele für KI-Interaktionen nennt Meta Nachrichten, die Nutzer*innen oder andere Personen von der KI erhalten, mit ihr teilen oder an diese senden.

Diese Angaben schließen private Sprachnachrichten und Transkriptionen nicht aus. Metas Umschreibung passt auch auf Chatverläufe mit Chatbots. Solche Chatverläufe können besonders sensible Daten enthalten, wenn etwa Chatbots für intime Gespräche zu mentaler Gesundheit oder parasoziale romantische Beziehungen genutzt werden.

Verbraucherzentrale scheitert vor Gericht

Um den Beginn des Trainings zu verhindern, hat die Verbraucherzentrale Nordrhein-Westfalen im Mai 2025 einen Eilantrag beim Oberlandesgericht (OLG) Köln gestellt. Sie argumentierte insbesondere, dass Meta das Training nicht auf eine wirksame Rechtsgrundlage stützen könne, ist mit dem Eilantrag jedoch gescheitert. Das Urteil und Einblicke in die mündliche Verhandlung in Köln offenbaren erhebliche Mängel.

Meta hatte sich entschieden, keine Einwilligungen einzuholen, sondern beruft sich auf ein berechtigtes Interesse an der Nutzung der Daten für KI-Training. Die Verbraucherzentrale hält das für unzureichend, doch das Gericht folgt Metas Argumentation in seinem Urteil. Nach der Datenschutzgrundverordnung (DSGVO) können berechtigte Interessen die Verarbeitung personenbezogener Daten rechtfertigen, solange die Interessen Betroffener nicht schwerer wiegen. Dabei müssen diese der Datenverarbeitung aber widersprechen können.

Die Verbraucherzentrale NRW hat darauf hingewiesen, dass nicht alle Betroffenen widersprechen können. Facebook- und Instagram-Beiträge enthalten zuhauf personenbezogene Daten von Nicht-Nutzer*innen. Die Widerspruchsfunktion steht aber nur Nutzer*innen offen. Das Gericht ignoriert diesen Einwand. Zudem behauptet es ohne Begründung und trotz gegenteiliger Hinweise, Meta erfülle die Anforderungen der DSGVO an den Schutz von Minderjährigen.

Das Gericht halluziniert niedrige Risiken herbei

Berechtigte Interessen geben außerdem keine Rechtsgrundlage für Verarbeitungen her, die für Betroffene zu riskant sind. Das OLG Köln behauptet, die Risiken für Nutzer*innen seien gering. Dabei legt das Urteil nahe, dass die Richter*innen nicht verstanden haben, was Meta trainiert. Das Wort „Llama“ taucht im gesamten Urteil nicht auf. Auch beschreibt das Gericht keine Anwendungsszenarien.

Auf diese kommt es aber entscheidend an. Ein Transkriptionsfeature gibt wahrscheinlich keine extrahierbaren Daten aus. Aus Llama selbst werden jedoch sicher Daten extrahiert. Forscher*innen wenden Extrahierungsmethoden auf alle bekannten Modelle an. Je nachdem, welche Arten von Daten wie gut extrahierbar sind, könnte es dabei versehentlich auch zu Datenlecks kommen.

Gerichte prüfen in Eilverfahren die Rechtslage nur „kursorisch“, also nicht im Detail. Das OLG Köln reiht dabei aber mit großem Selbstbewusstsein Behauptungen aneinander, die aus Sicht der Datenschutzforschung haltlos sind. Selbst wenn Metas Training transparent genug wäre, fehlt es an tragfähigen Forschungsergebnissen für die Einschätzung des Gerichts.

Ein grober Fehler des Urteils betrifft besondere Kategorien personenbezogener Daten. Das sind sensible Daten, die die DSGVO besonders schützt, zum Beispiel Daten über Race, religiöse Anschauungen oder sexuelle Orientierungen. Social-Media-Daten enthalten viele solcher Daten. Besondere Kategorien personenbezogener Daten dürfen nicht auf Basis berechtigter Interessen verarbeitet werden, sondern nur unter strengeren Voraussetzungen, in vielen Fällen nur aufgrund von Einwilligungen. Das OLG Köln stört sich daran nicht.

Stattdessen behauptet das Gericht, dass die Anwendung der besonderen Schutzanforderungen nicht geboten sei. Das Urteil stellt hier wieder auf ein nicht weiter begründetes geringes Risiko ab. Dabei kommt es gerade im Bereich des maschinellen Lernens leicht zu unbemerkten Modellbias, also zu systematischen Fehleinschätzungen, die zum Beispiel zu rassistischer Diskriminierung führen. Besondere Kategorien personenbezogener Daten bergen dabei potenziell besonders hohe Risiken.

Bedenkliche Informationslage

Bedenklich ist zudem die Informationslage, auf die sich das Gericht stützt. In diesem Fall sind das vor allem die Angaben von Meta selbst. Das ist in einem Eilverfahren an sich nicht zu beanstanden – weil es schnell gehen muss, gelten geringere Beweisanforderungen. Gerichte arbeiten daher mit eidesstattlichen Versicherungen, formellen Erklärungen der Parteien. Um Falschangaben vorzubeugen, sind falsche eidesstattliche Versicherungen nach dem Strafgesetzbuch strafbar.

Das Urteil stellt entscheidend auf eidesstattliche Versicherungen von Metas Produktmanager für generative KI ab. Zwei in der mündlichen Verhandlung in Köln anwesende Personen berichten allerdings, dass die Versicherungen nie formgerecht abgegeben worden sind. (Die Autorin hat von zwei in der Verhandlung in Köln anwesenden Personen Informationen zum Ablauf der mündlichen Verhandlung und dabei getroffenen Aussagen des Gerichts erhalten. Eine der Personen ist seitens der klagenden Verbraucherzentrale am Verfahren beteiligt, die andere Person hat den Prozess beobachtet, ohne daran beteiligt zu sein.)

Eidesstattliche Versicherungen müssen mündlich oder im Original mit händischer Unterschrift abgegeben werden. Selbst wenn die Erklärungen von Meta formgerecht wären, hätte sich das OLG Köln besser nicht darauf verlassen. Es gibt zwar keine Anzeichen dafür, dass diese Falschangaben enthalten. Durch das deutsche Strafgesetzbuch wäre deren Richtigkeit aber nicht abgesichert: Falls der in Kalifornien ansässige Manager nicht einreisen will, hätten Falschangaben keine strafrechtlichen Folgen für ihn.

Zudem legt das Urteil nahe, dass Metas Erklärungen inhaltlich dünn sind. Sie bestätigen etwa das Funktionieren der Widerspruchsfunktion. Eine Pressemitteilung der für Meta zuständigen irischen Datenschutzbehörde (Data Protection Commission, DPC) zeigt jedoch, dass die Behörde Meta zur Nachbesserung der Widerspruchsfunktion aufgefordert hat. Es bleibt somit zweifelhaft, ob Widersprüche in der Vergangenheit einfach genug möglich waren und funktioniert haben.

Datenschutzbehörden lassen Meta erst mal machen

Auch die Pressemitteilung der irischen Datenschutzbehörde und der Umgang des Gerichts damit verdienen besondere Aufmerksamkeit. Die für ihre Nachsicht gegenüber Datenkonzernen bekannte Behörde hat die Pressemitteilung am Vorabend der mündlichen Verhandlung in Köln veröffentlicht. Sollte die Behörde sich etwa mit Meta abgestimmt und so das Verfahren beeinflusst haben?

Das OLG Köln hat nach Berichten Anwesender schon in der mündlichen Verhandlung signalisiert, der Rechtsauffassung der irischen Behörde wahrscheinlich folgen zu müssen, warum auch immer das Gericht sich an deren Einschätzung auch nur lose gebunden fühlt. Das ist nicht nur im Hinblick auf die Gewaltenteilung bedenklich. Die Pressemitteilung enthält auch keinerlei Rechtsauffassung zur Frage nach der Datenschutzkonformität, der das Gericht folgen könnte. Sie enthält schlicht gar keine rechtliche Einschätzung. Es heißt lediglich, Meta habe in Absprache mit der Behörde Maßnahmen zur Verbesserung des Datenschutzes ergriffen und verfolge die Umsetzung weiter.

Aus der Pressemitteilung wird ersichtlich, dass die irische Behörde Meta nur beraten hat. Das war dem OLG Köln auch von Metas Hauptaufsichtsbehörde in Deutschland, dem Hamburger Datenschutzbeauftragten, bekannt. Im Urteil heißt es ausdrücklich, die Behörde habe Meta das Training „bislang“ nicht untersagt und beobachte derzeit die Folgen der Trainings.

Der Hamburger Datenschutzbeauftragte hatte im Juli 2024 die Datenschutzauswirkungen des Trainings generativer Sprachmodelle noch unterschätzt. Nach Berichten aus der mündlichen Verhandlung hat er angesichts seiner Einblicke in Metas Training diese Auffassung zurückgenommen, erhebliche Datenschutzbedenken geäußert und zunächst sogar ein eigenes Verfahren gegen Meta angekündigt. Außerdem berichtete er, dass die irische Behörde plane, ein Verletzungsverfahren im Oktober einzuleiten. Das spricht dafür, dass europäische Datenschutzbehörden von Verstößen wissen, Meta aber zunächst gewähren lassen.

Wider den KI-Hype

Die Bedeutung des Kölner Verfahrens weist über Meta und über Deutschland hinaus. Das Urteil und die Vorgänge im Prozess legen nahe, dass europäische Gerichte und Aufsichtsbehörden bei KI dem Ansatz „Abwarten und Teetrinken“ folgen. Es lässt sich nur spekulieren, welche Rollen hier der Druck des KI-Hypes, Innovationspläne der EU oder auch blanke Naivität spielen.

Dabei macht die DSGVO nicht nur klare Vorgaben an KI-Unternehmen, sondern bietet diesen auch ausreichende Möglichkeiten, sich an die Vorgaben zu halten. Demnach müssen KI-Unternehmen die Datenschutzkonformität ihrer Vorhaben begründet nachweisen. Sie dürfen ihre Modelle trainieren und testen – allerdings nur zu reinen Forschungszwecken und ohne die KI in der Praxis einzusetzen – und damit blind auf die Menschheit loszulassen. Gerichte und Aufsichtsbehörden sollten diese Vorgaben durchsetzen, anstatt sich dem KI-Hype zu beugen.

Prof. Dr. Paulina Jo Pesch ist Juniorprofessorin für Bürgerliches Recht sowie das Recht der Digitalisierung, des Datenschutzes und der Künstlichen Intelligenz am Institut für Recht und Technik der Friedrich-Alexander-Universität Erlangen-Nürnberg. Sie koordiniert das vom Bundesministerium für Forschung, Technologie und Raumfahrt (BMFTR) geförderte interdisziplinäre Forschungsprojekt SMARD-GOV, das Datenschutzaspekte großer Sprachmodelle erforscht.

Eine englischsprachige Langfassung der Analyse des Verfahrens sowie eines weiteren Verfahrens beim OLG Schleswig-Holstein ist im CR-online blog erschienen.

Die Arbeit von netzpolitik.org finanziert sich zu fast 100% aus den Spenden unserer Leser:innen.
Werde Teil dieser einzigartigen Community und unterstütze auch Du unseren gemeinwohlorientierten, werbe- und trackingfreien Journalismus jetzt mit einer Spende.