Generative KI: Definition, Funktionsweise und Anwendungsfälle 2026

Was ist generative KI?

Generative KI (auch: Generative AI oder GenAI) ist ein Teilbereich der künstlichen Intelligenz, der maschinelle Lernmodelle nutzt, um auf Basis von Trainingsdaten vollständig neue Inhalte zu erzeugen: Text, Bilder, Audio, Video und Code. Anders als klassische KI-Systeme, die vorhandene Daten analysieren oder klassifizieren, erschafft generative KI originäre Ausgaben, die so vorher nicht existiert haben.

Die wichtigsten Ausgabeformate generativer KI im Überblick:

Text: Artikel, E-Mails, Zusammenfassungen, Chatantworten
Bild: Fotos, Illustrationen, Designvorlagen
Audio: Sprachsynthese, Musik, Podcasts
Video: Kurzclips, Animationen, Videoeffekte
Code: Programmiervorschläge, Funktionsgenerierung, Tests

Der entscheidende Unterschied zur klassischen KI: Ein Spam-Filter erkennt unerwünschte E-Mails und liefert ein Urteil. Generative KI schreibt auf Anfrage die nächste E-Mail selbst. Kein gradueller Unterschied, sondern ein grundlegend anderes Funktionsprinzip.

Technisch basiert moderne generative KI auf sogenannten Foundation Models: sehr große neuronale Netze, vortrainiert auf Milliarden von Datenpunkten, die dann für spezifische Aufgaben verfeinert werden. GPT-4o, Claude 3.7 und Gemini 1.5 sind solche Foundation Models. Auf ihnen bauen die meisten GenAI-Produkte auf, die heute im Einsatz sind.

Der Begriff „generativ“ beschreibt genau diese Fähigkeit: etwas Neues erschaffen. Punkt. Eine Suchmaschine gibt Treffer zurück, die bereits existieren. Ein generatives KI-System dagegen synthetisiert eine vollständig neue Antwort, die so noch nirgends stand und die das Modell in diesem Moment zum ersten Mal formuliert. Das ist ein fundamentaler Unterschied in der Funktionslogik.

Wie funktioniert generative KI?

Generative KI lernt statistische Muster in massiven Datensätzen durch eine Architektur namens Transformer, speichert dieses Wissen in Milliarden von Modellparametern und erzeugt bei einem Prompt neue Inhalte, indem es wahrscheinlichste Fortsetzungen berechnet. Das Ergebnis wirkt kreativ, folgt aber immer mathematischen Wahrscheinlichkeiten.

Der Prozess lässt sich in drei Schritte unterteilen:

Training auf Daten: Das Modell wird mit riesigen Textmengen, Bildarchiven oder Code-Repositories trainiert. Es lernt, das nächste Wort, das nächste Pixel oder das nächste Token vorherzusagen.
Muster erkennen: Durch Millionen von Trainingsschritten kodiert das Modell Beziehungen zwischen Konzepten, Grammatikregeln, Bildstrukturen und logische Zusammenhänge in seinen Parametern.
Neue Inhalte generieren: Beim Inference wird ein Prompt als numerische Repräsentation kodiert. Das Modell berechnet daraufhin wahrscheinliche Fortsetzungen und erzeugt Token für Token, Pixel für Pixel eine neue Ausgabe.

Nach dem Vortraining kommt ein entscheidender Schritt: RLHF. Das Kürzel steht für Reinforcement Learning from Human Feedback. Dabei bewerten menschliche Tester Modellantworten nach Qualität, Sicherheit und Nützlichkeit, und das Modell wird iterativ so angepasst, dass seine Ausgaben den menschlichen Präferenzen zunehmend entsprechen. Ohne diesen Schritt wäre ChatGPT so, wie wir es heute kennen, nicht denkbar. Viele moderne Modelle ergänzen RLHF mit neueren Verfahren wie RLAIF oder DPO, aber das Grundprinzip bleibt identisch: menschliches Feedback formt die Ausgaben so, dass sie nützlich, sicher und plausibel klingen.

Die Transformer-Architektur als Grundlage

Google-Forscher führten den Transformer 2017 ein. Seitdem ist er die dominierende Architektur für generative KI. Das Herzstück ist der sogenannte Self-Attention-Mechanismus: Das Modell bewertet bei der Verarbeitung jedes Tokens, welche anderen Tokens im Kontext am relevantesten sind. Wenn das Modell das Wort „Bank“ verarbeitet, entscheidet Self-Attention anhand des Kontexts, ob es um ein Geldinstitut oder eine Sitzgelegenheit geht.

Diese Fähigkeit, weitreichende Abhängigkeiten in langen Texten zu erfassen, ist der Grund, warum Transformer-Modelle in natürlicher Sprache so viel besser abschneiden als frühere Ansätze. GPT-4 und Claude basieren beide auf dieser Architektur, ebenso wie Gemini von Google.

Beim Training von Foundation Models ist kein menschliches Labeling nötig: Das Modell lernt im Self-supervised Learning aus der Struktur der Daten selbst, indem es immer das nächste Element in einer Sequenz vorhersagt und sich bei Fehlern korrigiert. Heraus kommen Modelle mit Hunderten von Milliarden Parametern, die ein enormes Weltwissen kodieren.

Wichtig: Das Modell „versteht“ nicht, was es gelernt hat, im menschlichen Sinne. Es hat statistische Beziehungen zwischen Konzepten kodiert. Wer fragt, warum ein Hammer das beste Werkzeug ist, um einen Nagel einzuschlagen, bekommt eine plausible Antwort, weil das Modell gelernt hat, was in diesem Kontext typischerweise gesagt wird. Das ist mächtig und hat gleichzeitig klare Grenzen.

Vom Training zur Ausgabe: Wie GenAI einen Prompt verarbeitet

Wenn man ChatGPT oder Claude einen Prompt eingibt, passiert folgendes: Der Text wird in sogenannte Tokens zerlegt (ungefähr Silben oder kurze Wortfragmente) und in einen hochdimensionalen Vektorraum kodiert, den sogenannten Latent Space. Von dort generiert das Modell Token für Token die Antwort, wobei es bei jedem Schritt aus einer Wahrscheinlichkeitsverteilung über alle möglichen nächsten Tokens auswählt.

Genau deshalb klingen Sprachmodelle manchmal so flüssig und dennoch falsch: Plausibilität und faktische Korrektheit sind im Modell zwei verschiedene Dinge. Bild-KI funktioniert nach einem anderen Prinzip. Diffusionsmodelle wie DALL-E 3 oder Stable Diffusion fügen beim Training schrittweise Rauschen zu Bildern hinzu und lernen, diesen Prozess umzukehren: aus zufälligem Rauschen ein kohärentes Bild zu erzeugen, das zur Textbeschreibung passt.

Die Ausgabequalität hängt von drei Faktoren ab: Modellgröße, Qualität und Vielfalt der Trainingsdaten sowie dem Maß der Feinabstimmung für die konkrete Aufgabe.

Arten von generativen KI-Modellen

Generative KI ist keine einzelne Technologie. Die wichtigsten Kategorien umfassen Text-KI (LLMs wie ChatGPT, Claude, Gemini), Bild-KI (DALL-E 3, Midjourney, Stable Diffusion), Code-KI (GitHub Copilot, Codestral), Audio-KI (ElevenLabs, Suno) und Video-KI (Runway, Sora).

Kategorie	Beispiel-Modelle	Typischer Anwendungsfall
Text-KI	ChatGPT (OpenAI), Claude (Anthropic), Gemini (Google)	Texterstellung, Chatbots, Programmierung
Bild-KI	DALL-E 3 (OpenAI), Midjourney, Stable Diffusion	Bildgenerierung, Design, Marketing
Code-KI	GitHub Copilot (Microsoft), Codestral (Mistral)	Programmierung, Code-Vervollständigung
Audio-KI	ElevenLabs, Suno	Sprachsynthese, Musik, Podcasts
Video-KI	Runway, Sora (OpenAI)	Videoschnitt, Effekte, Animationen

Text-KI: Large Language Models (LLMs)

Große Sprachmodelle (Large Language Models, kurz LLMs) sind der bekannteste Typ generativer KI. Sie erzeugen Text auf Basis des Transformer-Mechanismus, indem sie Token für Token die wahrscheinlichste Fortsetzung berechnen.

Drei Modelle dominieren den Markt: ChatGPT von OpenAI brachte generative KI 2022 in den Mainstream. Claude von Anthropic ist besonders für seinen Umgang mit langen Dokumenten und seinen Fokus auf Sicherheit bekannt. Gemini von Google ist tief in das Google-Ökosystem integriert und erlaubt multimodale Eingaben direkt in der Google-Suche und in Workspace.

LLMs werden nicht nur für Konversation genutzt. Sie übersetzen Texte, erstellen Zusammenfassungen, schreiben Marketingtexte, beantworten Rechtsfragen auf Basis hochgeladener Dokumente und erklären Programmiercode. In deutschen Unternehmen sind sie inzwischen in Marketingabteilungen und im Kundensupport produktiv im Einsatz.

Bild-KI: Von DALL-E bis Midjourney

Bild-KI-Modelle verwenden überwiegend Diffusionstechnologie. Der Prozess beginnt mit einem Textprompt, der in eine numerische Repräsentation übersetzt wird. Darauf aufbauend „entrauscht“ das Modell schrittweise ein zufälliges Bildrauschen, bis ein kohärentes Bild entsteht, das zur Beschreibung passt.

DALL-E 3 ist direkt in ChatGPT integriert und ermöglicht die Bildgenerierung per Sprachprompt. Midjourney läuft über Discord und ist vor allem für hochwertige, künstlerisch stilisierte Ausgaben bekannt. Stable Diffusion ist das wichtigste Open-Source-Modell, das lokal auf eigener Hardware betrieben werden kann, was es für datenschutzbewusste Nutzer besonders interessant macht.

Im deutschen Marketingumfeld werden Bild-KI-Modelle für Social-Media-Grafiken, Produktvisualisierungen und Werbekampagnen eingesetzt.

Code-, Audio- und Video-KI

Unter Entwicklern hat Code-KI die höchste produktive Verbreitung erreicht. GitHub Copilot, entwickelt von Microsoft und OpenAI, schlägt in Echtzeit ganze Funktionsblöcke vor, generiert Unit-Tests und dokumentiert Code. Codestral von Mistral ist spezialisiert auf Codeaufgaben und unterstützt über 80 Programmiersprachen.

Audio-KI wie ElevenLabs erzeugt synthetische Stimmen in über 30 Sprachen, die von echten Sprechern kaum noch zu unterscheiden sind. Suno komponiert auf Texteingabe vollständige Musikstücke inklusive Gesang. Beide Technologien sind inzwischen im professionellen Podcast- und Werbebusiness angekommen.

Video-KI steht noch am Anfang, entwickelt sich aber schnell. Runway erlaubt das Bearbeiten und Verlängern von Videoclips per Textprompt. Sora von OpenAI generiert kurze Videoclips aus einer Textbeschreibung. Qualität und Konsistenz verbessern sich in diesem Bereich monatlich.

Generative KI vs. klassische KI: Was ist der Unterschied?

Klassische KI analysiert vorhandene Daten und klassifiziert oder prognostiziert. Generative KI erschafft neue Inhalte, die in dieser Form noch nicht existiert haben. Kein kleiner Unterschied: Es sind grundlegend verschiedene Ziele.

Ein Beispiel: Ein Spam-Filter (klassische KI) liest eine E-Mail und entscheidet: Spam oder kein Spam. Ein Chatbot auf Basis generativer KI schreibt auf Anfrage selbst eine neue E-Mail. Eine Bilderkennungs-KI (klassisch) identifiziert, ob auf einem Foto eine Katze zu sehen ist. DALL-E (generativ) erzeugt auf Basis eines Textprompts ein völlig neues Bild einer Katze.

Eigenschaft	Klassische KI	Generative KI
Ziel	Analysieren / Klassifizieren	Neue Inhalte erschaffen
Ausgabe	Vorhersage / Kategorie	Text / Bild / Audio / Video / Code
Trainingsansatz	Supervised Learning	Self-supervised / Unsupervised
Beispiel	Spam-Filter, Bilderkennung	ChatGPT, DALL-E
Stärke	Musterklassifikation	Kreative Inhaltsgenerierung

Klassische KI-Systeme lernen typischerweise mit gelabelten Daten: Ein Mensch zeigt dem Modell tausende Beispiele, was Spam ist und was nicht. Generative KI-Modelle lernen dagegen im Self-supervised Learning ohne manuelles Labeling, indem sie die innere Struktur von Daten erschließen.

In der Praxis überschneiden sich beide Ansätze. Viele generative Systeme nutzen klassische KI-Techniken als Teilkomponenten, etwa für die Auswahl der nächsten Tokens oder für Sicherheitsfilter. Und klassische Systeme wie Empfehlungsalgorithmen werden zunehmend durch generative Komponenten ergänzt.

Für den Alltag ist die wichtigste Konsequenz klar: Klassische KI liefert verlässliche, deterministische Ergebnisse für klar abgegrenzte Aufgaben. Generative KI liefert kreative, flexible Ausgaben für offene Aufgaben, aber keine garantierten Fakten. Beide Typen haben ihren Platz, und der Einsatz sollte vom konkreten Problem abhängen.

Anwendungsfälle und Einsatzbereiche generativer KI

Am breitesten verbreitet ist generative KI in Marketing, Softwareentwicklung, Kundenservice und Bildung, aber auch Medizin, Recht und Finanzdienstleistungen sind längst betroffen. Laut Branchenberichten haben über 70 Prozent der deutschen Großunternehmen generative KI bereits in mindestens einem Prozess eingesetzt oder pilotiert.

Generative KI in Marketing und Kreativbranche

Content-Teams nutzen generative KI, um Blogartikel, Social-Media-Beiträge, Produktbeschreibungen und Werbetexte zu erstellen. Der typische Workflow: Das Modell liefert einen Erstentwurf, ein menschlicher Redakteur verfeinert und prüft. Was früher Stunden dauerte, dauert jetzt Minuten.

Im SEO-Bereich werden LLMs genutzt, um Briefings zu erstellen, Meta-Beschreibungen zu formulieren und Keywordstrukturen zu entwickeln. In der Bildsprache ersetzt Bild-KI erste Entwürfe, Stockfotos für interne Präsentationen und einfache Produktvisualisierungen. Für Agenturen und Content-Teams mit hohem Volumen ist generative KI kein Experiment mehr, sondern Standardwerkzeug.

Ein konkretes Beispiel für den deutschen Markt: E-Commerce-Shops mit tausenden Produkten nutzen generative KI, um Produktbeschreibungen in Varianten für verschiedene Zielgruppen, Kanäle und Tonalitäten zu erzeugen. Manuell wäre das mit vertretbarem Aufwand nicht möglich.

KI in der Softwareentwicklung

Entwickler profitieren von Code-KI besonders deutlich: GitHub Copilot vervollständigt Funktionen, schlägt Unit-Tests vor und erklärt fremden Code auf Anfrage. Die Produktivitätssteigerung in Coding-Aufgaben gehört zu den am besten dokumentierten Effekten von GenAI.

Der Einsatz geht über Autovervollständigung hinaus. KI-Modelle werden für Code-Reviews, Dokumentation, Datenbankabfragen und das Debugging komplexer Fehler eingesetzt. Python, JavaScript und SQL profitieren am stärksten, weil die Trainingskorpora für diese Sprachen besonders groß sind.

Weitere Branchen: Medizin, Recht, Bildung, Kundenservice

Medizin: Generative KI beschleunigt die Medikamentenentwicklung, indem sie synthetische Proteinsequenzen erzeugt und Molekülstrukturen vorhersagt. Synthetische Patientendaten ermöglichen medizinische Forschung ohne Datenschutzrisiken aus echten Patientenakten.

Recht: Kanzleien nutzen LLMs, um Verträge zusammenzufassen, relevante Paragraphen aus langen Dokumenten zu extrahieren und Standardverträge zu entwerfen. Die rechtliche Verantwortung bleibt beim Anwalt. Die KI übernimmt den Rechercheaufwand.

Bildung: Lehrkräfte erstellen Unterrichtsmaterialien, Quiz-Fragen und differenzierte Aufgaben für unterschiedliche Leistungsniveaus. Schülerinnen und Schüler nutzen KI für Recherche, Strukturierung von Aufsätzen und Erklärungen schwieriger Konzepte, was gleichzeitig Fragen zur akademischen Integrität aufwirft.

Kundenservice: KI-gestützte Chatbots beantworten Produktfragen, leiten komplexe Anfragen weiter und generieren kontextbezogene Antworten, die nicht auf starren Entscheidungsbäumen basieren. Das bedeutet: Sie können mit Fragen umgehen, die der ursprüngliche Entwickler nicht vorhergesehen hat.

Finanzdienstleistungen: Banken und Versicherungen nutzen generative KI für die Zusammenfassung regulatorischer Dokumente, personalisierte Finanzberatung auf Basis von Kontodaten und die automatisierte Erstellung von Auswertungsberichten. Gleichzeitig gelten in der Finanzbranche besonders strenge Compliance-Anforderungen, die den Einsatz eingrenzen.

Chancen und Vorteile generativer KI

Drei Bereiche bringen den größten Nutzen: Effizienz bei der Erledigung von Aufgaben, Kreativität auf Abruf und Skalierbarkeit ohne proportionalen Personalmehraufwand.

Die wichtigsten Vorteile im Detail:

Zeitersparnis: Aufgaben, die früher Stunden dauerten, erledigt generative KI in Minuten. Ein erster Artikel-Entwurf, eine Produktbeschreibung, ein Code-Snippet: alles auf Abruf verfügbar.
Skalierbarkeit: Hunderte Textvariationen, personalisierte E-Mails oder individualisierte Lerninhalte lassen sich ohne proportionalen Personaleinsatz erzeugen. Personalisierung in großem Maßstab wird erstmals praktisch umsetzbar.
Breiterer Zugang zu Expertise: Ein kleines Team kann mit generativer KI Rechtsdokumente zusammenfassen, Datenanalysen durchführen oder professionellen Code schreiben, ohne Spezialisten für jeden Bereich einzustellen.
Kostensenkung: Repetitive kreative und analytische Aufgaben lassen sich automatisieren. Das senkt den Kostenaufwand pro Ausgabeeinheit erheblich.
Kreative Impulse: Generative KI liefert auf Anfrage Entwürfe, Alternativen und Variationen, die als Ausgangspunkt für menschliche Kreativarbeit dienen. Sie ersetzt keine Ideen, gibt aber Startpunkte vor.
24/7-Verfügbarkeit: Generative KI steht rund um die Uhr bereit, ohne Pausenbedarf, Urlaub oder Krankheitsausfall.

Risiken und Grenzen generativer KI

Generative KI birgt konkrete Risiken: Halluzinationen, Bias durch Trainingsdaten, unklare Urheberrechtsfragen, erheblicher Energieverbrauch und Datenschutzbedenken im deutschen und europäischen Kontext.

Die wichtigsten Risiken im Detail:

Halluzinationen: Generative Modelle erzeugen manchmal sachlich falsche Informationen mit großer Überzeugungskraft. Ein LLM kennt keine Fakten, es berechnet, was wahrscheinlich als nächstes kommt. Falsche Quellenangaben, erfundene Gerichtsurteile oder fehlerhafte Statistiken sind reale Risiken, die menschliche Prüfung unverzichtbar machen.
Bias: Wenn Trainingsdaten bestimmte Gruppen unterrepräsentieren oder historische Vorurteile widerspiegeln, reproduziert das Modell diese. Bild-KI-Systeme haben nachweislich überwiegend männliche, weiße Figuren für Führungsrollen generiert. Das ist keine Hypothese, sondern dokumentiertes Verhalten.
Urheberrecht und rechtliche Unsicherheit: Es laufen mehrere große Klagen gegen KI-Unternehmen wegen der Nutzung urheberrechtlich geschützter Inhalte als Trainingsdaten. Die Rechtslage ist weder in den USA noch in der EU abschließend geklärt.
Datenschutz (DSGVO): Wer personenbezogene Daten von Kunden oder Mitarbeitern in externe KI-Dienste eingibt, muss prüfen, ob ein Datenverarbeitungsvertrag (AVV) nach Art. 28 DSGVO vorliegt. Sensible Kategorien dürfen grundsätzlich nicht ohne Einwilligung verarbeitet werden. Das Bundesamt für Sicherheit in der Informationstechnik (BSI) hat Orientierungshilfen für den sicheren Einsatz von KI-Diensten veröffentlicht, die Unternehmen als Ausgangspunkt nutzen sollten.
Energieverbrauch: Das Training großer KI-Modelle erfordert enorme Rechenleistung. Der steigende Energiebedarf von KI-Rechenzentren ist ein zunehmend regulierungsrelevantes Thema in der EU und in der deutschen Klimapolitik.
Arbeitsmarktveränderungen: Einige Berufsbilder in Texterstellung, Bildproduktion und einfachem Kundensupport sehen bereits veränderte Nachfrage. Die Nettoauswirkungen auf Beschäftigung sind komplex und laut Experten noch nicht abschließend beurteilbar.

Wie fange ich mit generativer KI an?

Der einfachste Einstieg führt über drei kostenlose Zugänge: ChatGPT (chat.openai.com), Claude (claude.ai) und Gemini (gemini.google.com), alle ohne Vorkenntnisse direkt im Browser nutzbar.

Fünf konkrete Schritte für den Start:

Einen kostenlosen Zugang wählen: ChatGPT, Claude.ai und Gemini sind alle kostenlos verfügbar. Kein Download, keine technischen Kenntnisse nötig. Einfach im Browser öffnen und starten.
Einen konkreten Use-Case identifizieren: Vage Experimente bringen wenig. Besser: eine echte Aufgabe auswählen, etwa E-Mail-Entwürfe schreiben, Code-Snippets erstellen, Meetings zusammenfassen oder eine Produktbeschreibung formulieren.
Prompts klar formulieren: Vollständige Sätze, konkreter Kontext und eine klare Zielangabe führen zu deutlich besseren Ergebnissen. Schlecht: „Schreib einen Text über KI.“ Gut: „Schreib einen 200-Wörter-Absatz über generative KI für Leser ohne technischen Hintergrund, sachlich und ohne Fachjargon.“
Ergebnisse kritisch prüfen: KI-Ausgaben sind Entwürfe, keine Fakten. Zahlen, Quellenangaben und Behauptungen immer eigenständig verifizieren. Halluzinationen kommen auch bei den besten Modellen vor.
Schritt für Schritt optimieren: Prompts verfeinern, Ergebnisse bewerten, Variationen ausprobieren. Wer ein gutes Prompt-Template entwickelt hat, kann es für ähnliche Aufgaben wiederverwenden.

Checkliste: Bereit für generative KI?

Ich habe einen konkreten Anwendungsfall identifiziert, nicht nur Neugier
Ich weiß, welche Daten ich eingebe und ob diese unter die DSGVO fallen
Ich habe einen Prozess, um KI-Ausgaben zu prüfen und zu verifizieren
Ich verstehe, dass KI-Ergebnisse Entwürfe sind und keine fertigen Fakten
Ich habe einen kostenlosen Zugang gewählt und bin bereit, klein anzufangen

FAQ: Häufige Fragen zur generativen KI

Frage: Was ist der Unterschied zwischen generativer KI und KI allgemein?

Antwort: Künstliche Intelligenz ist der Oberbegriff für Systeme, die Aufgaben ausführen, die menschliche Intelligenz erfordern. Generative KI ist ein spezifischer Teilbereich, der sich auf die Erstellung neuer Inhalte konzentriert, anstatt nur Eingaben zu klassifizieren oder Vorhersagen zu treffen. Alle generative KI ist KI, aber nicht alle KI ist generativ.

Frage: Ist generative KI dasselbe wie ChatGPT?

Antwort: Nein. ChatGPT ist ein konkretes Produkt, das auf generativer KI basiert. Generative KI ist die übergeordnete Technologiekategorie. Zu ihr gehören neben ChatGPT auch Claude, Gemini, DALL-E, Midjourney, GitHub Copilot und viele weitere Modelle und Anwendungen.

Frage: Kann generative KI menschliche Kreativität ersetzen?

Antwort: Generative KI erzeugt Inhalte auf Basis gelernter Muster aus vorhandenen Daten. Sie kombiniert und variiert, was es schon gibt. Echte kreative Ideen, die Kontext, Erfahrung und Intention voraussetzen, entstehen weiterhin durch Menschen. KI ist ein leistungsstarkes Werkzeug für kreative Arbeit, kein Ersatz für sie.

Frage: Ist generative KI kostenlos nutzbar?

Antwort: Ja, für den Einstieg vollständig. ChatGPT (Basis), Claude.ai (Basis) und Gemini (Basis) sind kostenlos zugänglich. Für höhere Kapazitäten, schnellere Modelle oder erweiterte Funktionen bieten alle Anbieter kostenpflichtige Abonnements an, die typischerweise zwischen 18 und 30 Euro pro Monat liegen.

Frage: Welche generative KI ist die beste?

Antwort: Das hängt vom Anwendungsfall ab. Für lange Texte und Dokumentenanalyse ist Claude besonders stark. Für tägliche Aufgaben und Codierung ist ChatGPT sehr verbreitet. Gemini punktet bei der Integration in Google-Dienste. Für Bildgenerierung ist Midjourney qualitativ führend, DALL-E 3 durch die ChatGPT-Integration bequemer. Am sinnvollsten: alle drei Text-KI-Dienste kostenlos testen und selbst vergleichen.

Frage: Wie gefährlich ist generative KI?

Antwort: Generative KI birgt reale Risiken: Halluzinationen, die zu Falschinformationen führen, Deepfakes, die für Betrug und Desinformation genutzt werden, und Datenschutzprobleme beim unvorsichtigen Umgang mit sensiblen Daten. Kritischer Umgang, menschliche Kontrolle und klare Unternehmensrichtlinien minimieren diese Risiken erheblich.

Frage: Was bedeutet „Halluzination“ bei KI?

Antwort: Als Halluzination bezeichnet man Ausgaben, bei denen ein KI-Modell sachlich falsche Informationen mit hoher Überzeugungskraft präsentiert, etwa erfundene Quellenangaben, nicht existierende Gerichtsurteile oder falsche Statistiken. Das Modell lügt dabei nicht absichtlich: Es berechnet, welche Tokens wahrscheinlich als nächstes kommen, ohne Zugriff auf eine externe Faktendatenbank.

Frage: Darf ich generative KI im Beruf nutzen? (DSGVO-Aspekt)

Antwort: Grundsätzlich ja, aber mit wichtigen Einschränkungen. Wer personenbezogene Daten von Kunden oder Mitarbeitern in externe KI-Dienste eingibt, muss prüfen, ob ein Datenverarbeitungsvertrag (AVV) nach Art. 28 DSGVO vorliegt. Sensible Datenkategorien wie Gesundheitsdaten oder politische Überzeugungen dürfen grundsätzlich nicht ohne Einwilligung verarbeitet werden. Das BSI empfiehlt, interne Richtlinien für den KI-Einsatz zu entwickeln und Beschäftigte entsprechend zu schulen.

Frage: Wie viel Strom verbraucht generative KI?

Antwort: Training und Betrieb großer KI-Modelle sind energieintensiv. Eine einzelne ChatGPT-Anfrage verbraucht schätzungsweise mehrfach mehr Strom als eine klassische Google-Suche. Das Training eines großen Foundation Models wie GPT-4 erforderte laut Studien so viel Energie, wie fünf PKW während ihrer gesamten Lebenszeit erzeugen. Der steigende KI-Energiebedarf ist ein zunehmend regulierungsrelevantes Thema in der EU.

About the author

Generative KI: Was sie ist, wie sie funktioniert und wo sie eingesetzt wird