In einer Zeit, in der Künstliche Intelligenz (KI) in immer mehr Bereichen unseres Alltags Anwendung findet, lohnt es sich, den Überblick über die vielen Fachbegriffe und Konzepte zu behalten. Unser KI-Glossar von A bis Z bietet Ihnen eine verständliche und umfassende Ressource, um sich in der Welt der Generativen KI (GenAI) zurechtzufinden.

Egal, ob Sie ein Experte auf diesem Gebiet sind oder gerade erst Ihr Interesse an KI entdeckt haben: Dieses Glossar ist dazu gedacht, Ihr Wissen zu vertiefen. Wir aktualisieren es wöchentlich.

Fehlen Ihnen Begriffe? Gerne per Mail bei uns melden!

KI von A bis Z

A

AI Act

Gesetzgebung der EU, die damit als erster Staatenbund rechtlich bindende und auf definierten Risikoklassen basierende Vorgaben für die Entwicklung und den Einsatz von Künstlicher Intelligenz macht. Der AI Act soll noch im 2. Quartal 2024 in Kraft treten. Generative KI wird darin nur am Rande behandelt, da sie aus Sicht der Politik in eine untergeordnete Risikoklasse fällt.

Algorithmus

Algorithmen werden oft mit KI verwechselt. Ein Algorithmus ist eine klar definierte Anleitung, die Schritt für Schritt vorgibt, wie eine Aufgabe oder ein Problem zu lösen ist. Im Sinne eines Entscheidungsbaumes liefert ein Algorithmus auf jeden ihm bekannten Status (etwa „Ich möchte mich bei disruptive bewerben“ oder „Ich möchte einen Workshop buchen“ eine vorher definierte Antwort. Algorithmen sind per se zunächst keine KI – wenn die Systeme nicht in der Lage sind, Daten sukzessive besser zu verarbeiten und dazuzulernen.

Altman, Sam

Altman, CEO des ChatGPT-Erfinders OpenAI, ist das prominenteste Gesicht in der GenAI-Welt. Dies gilt mehr denn je seit November 2023, als OpenAI die wohl meistbeachte Management-Posse in der Tech-Welt aufführte: Erst wurde Altman völlig überraschend vom Verwaltungsrat gefeuert. Die Karriere des 38-Jährigen, der OpenAI mitgegründet hatte und schon in einem Atemzug mit IT-CEOs wie Mark Zuckerberg (siehe unten) genannt worden war und mit dem sich Politiker wie US-Präsident Joe Biden und Bundeskanzler Olaf Scholz hatten fotografieren lassen, schien abrupt zu enden.

Doch keine Woche später inthronisierte OpenAI seinen Chef wieder. Zwischendrin hatte Microsoft-CEO Satya Nadella damit geliebäugelt, Altman in sein Unternehmen zu holen. Dann war OpenAI-Verwaltungsrat Ilya Sutskever, offenbar der Chef-Gegenspieler Altmans, öffentlich bei „X“ nach Canossa gezogen und hatte sein Verhalten dort „zutiefst bedauert“. Dann gab es in sechs Tagen zwei Interims-CEO. Und schließlich hatten noch 500 von 700 OpenAI-Mitarbeiter:innen angedroht, aus Loyalität zu Altmann zu kündigen. Kurzerhand war der alte CEO sechs Tage später wieder der neue.


Die wichtigste Lehre der Chaos-Woche: OpenAI ist wirklich noch ein Startup, zumindest was Governance und Prozesse angeht.

B

Bard

Googles Chatbot Bard kam später als ChatGPT auf den Markt und war seit Juli 2023 in Deutschland verfügbar. Zuvor war Bard in den USA gefloppt, als der Bot bei der ersten Präsentation Unwahrheiten erzählt hatte. Obwohl mit Google ein Tech-Gigant hinter Bard steht, schaffte es das Tool zunächst nicht, zu ChatGPT und Co aufzuschließen. Zu schlecht war vor allem das sprachliche Ausdrucksvermögen. Im Dezember 2023 gab Google bekannt, Bard mit dem neuen Sprachmodell Gemini (s.u.) auszustatten, um die Leistung zu verbessern. Im Februar 2024 wurde dann sogar der Chatbot selbst in Gemini umbenannt.
Sie möchten mehr erfahren zu Chatbots und professionellem Prompting? Dann buchen Sie doch einen unserer KI-Workshops!

Bedtime Stories

Unser erstes CustomGPT! Lesen Sie Ihren Kindern persönliche und interaktive Gute-Nacht-Geschichten vor, inspiriert von modernen Märchen und mit Ihrem Kind als Held! „Bedtime Stories“ ist ein von uns entwickeltes Custom GPT, nutzbar in ChatGPT-4. Hier können Sie den Geschichten-Erzähler für 5€ auch für Ihre Kinder kaufen. Im Blog giibt es mehr Infos zu CustomGPTs.

Bing

Die Microsoft Suchmaschine hat vor GenAI kaum Relevanz gehabt. Dann hat Microsoft sie mit einer KI-Suche auf Basis von ChatGPT ausgestattet, und plötzlich zieht Bing an. Weltweit stieg die Anzahl der User im ersten Halbjahr 2023 auf 98 Millionen Menschen (plus 10 Prozent). Verglichen mit Google bleibt Bing mit einem Marktanteil von 3 Prozent klar hinten dran. Google erreicht aktuell etwa 1,12 Milliarden Menschen, schreibt das WSJ.

C

Claude 2

Das amerikanische KI-Forschungsunternehmen Anthropic hat mit Claude 2 einen direkten Konkurrenten zu ChatGPT auf den Markt gebracht. Sein Highlight: Claude 2 kann 75.000 Wörter gleichzeitig verarbeiten. Zum Vergleich: Bei ChatGPT4 ist der Input aktuell auf rund 25.000 Wörter begrenzt.
Anthropic wurde 2021von ehemaligen OpenAI-Forschenden gegründet und hat sich spätestens mit einem kolportierten 4-Mrd.-Dollar-Investment von Amazon im Herbst 2023 zu einem ernsthaften ChatGPT-Konkurrenten entwickelt. (Quelle: Reuters, 29.09.2023)

Copilot

„Copilot“ heißt die KI-Integration, mit der Microsoft das neue Windows 11 ausstattet. Bei uns im Blog steht, wieso Copilot die nächste KI-Revolution ist. Vor allem Mitarbeitende in Konzernen, deren Datenschutzabteilungen viele der neuen Tools bisher verboten hatten, werden profitieren.

Custom GPTs

OpenAI hat im November-2023-Update von ChatGPT ein ganz neues Features gestartet: „Custom GPTs“ sind eigene Chatbots, die man direkt im Tool erstellen kann – entweder für die eigene Nutzung oder zugänglich für alle Nutzer. Disruptiv ist der Schritt vor allem mit Blick auf das Geschäftsmodell der ChatGPT-Erfinder.

D

Detektoren

KI-Detektoren sind Programme, die KI-generierten Text von menschengemachten Text unterscheiden und diese entdecken. Hierbei analysieren sie die Texte anhand ihres Aufbaus und anhand ihres zugrundeliegenden Sprachmodells. Mehrere Start-ups sind aktuell damit beschäftigt, diese Dektoren zu kreieren und zu verfeinern. Die Erfolge sind im Moment noch überschaubar. (Quelle: finanzen.net, 06.08.2023)

Descript

Descript ist ein KI-Tool, das Text in Video oder Audio und zurück übersetzt. Die Software kann zudem Echtzeit-Untertitel erstellen. Im ersten Halbjahr 2023 galt Desript als das Tool schlechthin für die Videoerstellung. Wir bei disruptive arbeiten inzwischen lieber mit HeyGen und Synthesia (siehe unten).

E

Eleven Arms

Mit dem KI-Tool ElevenArms lassen sich Stimmen kopieren und mit beliebigen Texten füttern. Man muss kein Jurist sein, um darauf zu kommen, dass das ein gewisses Risiko des Missbrauchs birgt…

F

Firefly

Adobe verfügt über einen eigenen KI Bild-Generator mit dem Namen Firefly. Firefly verfügt über verschiedene 3d zu Bild, automatisierte Erweiterung, Text zu Bild, generative Umfärbung und Füllung. Firefly ist einzigartig, da Adobe mit lizenzierten Bildern aus ihrer eigenen Bilddatenbank Adobe Stock trainiert hat. Firefly kann somit kommerziell genutzt werden, ohne dass eine Verletzung des Urheberrechts befürchtet werden muss.

Seite Herbst 2023 ist Firefly auch auf Adobe Stock integriert, man kann also direkt in der Datenbank eigenen Bilder generieren, statt sich Stockmaterial zu suchen. Kosten: ab 9€ pro Highres-Eigenkreation. Reicht die Qualität nicht, keine Sorge: Es werden alternative Bilder aus dem Adobearchiv angeboten, die dem Thema des selbst generierten Bildes ähnlich sind. Der Vorteil gegenüber anderen Bild-KI-Generatoren ist die Rechtssicherheit, da die Bilder mit dem Adobe-Material trainiert wurden.

G

Gemini

heißt die Sprachmodell-Familie von Google, die im Dezember 2023 vorgestellt wurde. Das beste der drei Modelle soll sogar GPT-4 von OpenAI übertrumpfen. Bei uns im Blog steht, was das Duell über die Zukunft von Generativer KI sagt. Im Februar 2024 nannte Google sogar seinen Chatbot in „Gemini“ um.

Generative Pretrained Transformer

… ist die ausgeschriebene Form der vielfach genutzten Abkürzung GPT. „Generative vortrainierte Transformer“ sind Sprachmodelle für die Nutzung in GenAI. Den ersten GPT hat OpenAI entwickelt und im Jahr 2018 vorgestellt. GPT-Modelle sind mit großen Text-Datensätzen trainiert und in der Lage, durch die Verknüpfung dieser Inhalte neuartigen, menschenähnlichen Content zu generieren. Heute werden Large Language Models, also die großen Sprachmodelle, und GPTs oft gleich gesetzt.

Manchmal wird GPT auch mit „General purpose technology“ übersetzt – also als Allzwecktechnologie, die wirtschaftliche und soziale Strukturen drastisch verändern kann. Dieses Synonym soll auf die disruptiven Potenziale von GenAI hinweisen.

General-Purpose AI Models

General-Purpose AI Models (GPAI) sind KI-Systeme, die verschiedene Aufgaben bewältigen können. Während manche GenAI-Tools spezielle Zwecke erfüllen, bspw. die Übersetzung von Text, sind GPAI breiter angelegt und komplexer in der Entwicklung. Das bekannteste GPAI ist ChatGPT, das zum einen diverse Importe verarbeiten kann – von Text bis zu Sprache – und zugleicb auch unterschiedliche Medien ausgibt – seit der Integration von Dall-E auch Bilder.

Im AI Act der EU sind GPAIs explizit als regulierenswert erwähnt und werden auch strenger behandelt als „normale“ GenAI.

GPT-Store

Der im Januar 2024 gestartete GPT-Store von OpenAi erlaubt es Nutzer:innen und Entwickler:innen, eigene GPT-basierte Apps zu vermarkten. Experten vergleichen den Launch des Stores bereits mit der Einführung des App Stores von Apple in 2008. Mehr dazu bei uns im Blog.

GPUs

GPUs (Graphics Processing Units) sind Computerprozessoren, die vor allem für Grafikkarten genutzt werden. Im Gegensatz zu den üblichen Prozessoren, den CPUs (Central Processing Units), sind sie besonders gut in der parallelen Berechnungen großer Datenmengen. Ohne sie wäre Deep Learning, also der Ausbildung tiefer neuronaler Netzwerke, kaum möglich. Entsprechend groß ist aktuell bei KI-Firmen die Nachfrage nach diesen Prozessoren. Die größten GPU-Hersteller sind Firmen wie AMD oder NVIDIA (unten), die daher auch entsprechend vom GenAI-Boom profitieren.

Grokking

In bestimmten Situationen können KI-Modelle über ihre Trainingsdaten hinausgehende Schlussfolgerungen ziehen. Dieses Verhalten ist in der KI-Wissenschaft als „Grokking“ bekannt. Im Laufe des Trainingsprozesses erreichen KI-Modelle manchmal einen Punkt, an dem sie ein Problem wirklich „begreifen“, obwohl sie zuvor lediglich Trainingsdaten reproduziert haben.
„Grokking“, ein Begriff geprägt von dem US-Autor Robert A. Heinlein, bezeichnet in der KI-Welt dieses tiefe Verständnis. Wenn KI-Modelle „grokken“, ahmen sie Trainingsdaten nicht mehr nur nach, sondern finden verallgemeinerte Ansätze – sie entwickeln sich von einem zufälligen Nachplapperer zu einem KI-System, das ein echtes Verständnis des Problems entwickelt und Prognosen erstellt.

H

Halluzinationen

In der KI-Sprache bezeichnet der Begriff „Halluzinationen“ die Tendenz eines Modells, Informationen zu erzeugen, die nicht korrekt oder nicht in den Trainingsdaten enthalten sind. Das Modell generiert manchmal Antworten oder Daten, die irreführend, falsch oder einfach erfunden sind.
Diese Halluzinationen können durch verschiedene Faktoren verursacht werden, darunter unzureichende Trainingsdaten, Überanpassung an bestimmte Daten oder inhärente Unsicherheiten in der Modellarchitektur. Bei der Arbeit mit Large Language Models ist es daher wichtig, Antworten kritisch zu überprüfen.

HeyGen

Aktuell (Q4/2023) das am weitesten entwickelte Text-to-Video-Tool auf dem deutschen Markt. HeyGen wurde vor allem durch seine sehr realistisch agierenden Avatare bekannt. Wir nutzen es bei disruptive aktuell, um Avatar-basierte Erklär- und Schulungsfilme zu erstellen.
Mittelfristig wird Video-KI einen ähnlich großen Sprung nach vorne darstellen, wie es GenAI-Chatbots in 2023 getan haben: Künftig wird man mit wenigen Änderungen im Script in wenigen Minuten ein komplettes Video aktualisieren oder erweitern können – ein Aufwand, für den man früher Tage brauchte.

I

Ideogram

Ideogram ist ein KI-Bildgenerator, der nicht nur realistische Bilder erstellen, sondern auch Texte in Bildern korrekt darstellen kann, anders als Midjourney, dem Text in Bild immer noch schwer fällt (Stand Januar 2024). Ideogram ist derzeit kostenlos.

Internet

Mit dem Internetzugriff halten es Text-KIs sehr unterschiedliche. Perplexity und Google Gemini können für ihre Antworten das Netz durchsuchen, ChatGPT kann dies in seiner Grundversion 3.5 nicht, seine Datenbank speist sich aus Wissen bis April 2023. Die Bezahlversion ChatGPT 4 kann über Plugins wie Webpilot einzelne URLs abfragen. Seit September gibt es mit „Browse with Bing“ eine neue Funktion, die laut OpenAI „Internetzugriff“ ermöglicht. Der ist jedoch sehr begrenzt – teilweise wird ChatGPT sogar schlechter. Wieso, das beschreiben wir hier im Blog.

K

Kontextfenster

Das Kontextfenster eines Sprachmodells bestimmt, wie viel Text das KI-Tool verarbeiten kann. ChatGPT hat ein Kontextfenster von 4096 Token, entspricht etwa 3000 Wörtern. Das KI-Startup Anthropic erweiterte im Sommer 2023 das Kontextfenster seines ChatGPT-Konkurrenten Claude von bisher knapp 9.000 auf 100.000 Token. Das klingt beeindruckend, birgt aber auch Probleme. Das größte ist der erhöhte Bedarf an Rechenressourcen.

KI-Guidelines

… sind die Basis, damit Mitarbeitende in Firmen oder Organisatione KI-Tools sicher und professionell nutzen können. In unserem Blog zu KI-Guidelines für Unternehmen erklären wir, worauf es ankommt.

L

Large Language Models

Large Language Models (LLMs) sind maschinelle Lernmodelle, die darauf spezialisiert sind, Texte zu verstehen und zu generieren. Sie werden mittels enormer Datenmengen, insbesondere Texten, trainiert, um menschenähnliche Texte verfassen zu können. LLMs können Fragen beantworten, Texte schreiben, Übersetzungen durchführen und viele andere textbasierte Aufgaben erledigen. Beispiele für LLMs sind GPT von OpenAI oder Gemini von Google.

Lumiere

Lumiere ist eine generative KI von Google für fotorealistische Videos. Das Text-zu-Video-Modell ist Ende Januar 2024 vorgestellt worden und soll alternative Modelle, wie Pika und Stable Diffusion, klar übertreffen. Wann es in welchen Tools zum Einsatz kommt, ist noch nicht bekannt. Die ersten Bilder sind jedenfalls beeindruckend.

M

Med-PaLM 2

MedPaLM 2 kommt von Google und kann medizinische Dokumente zusammenfassen, Gesundheitsdaten organisieren und Antworten auf medizinische Fragen generieren. Die MedPaLM-Daten sind laut Google nicht für Google einsehbar. 

N

NVIDIA

NVIDIA ist ein amerikanisches Technologieunternehmen, das ursprünglich für die Entwicklung von Grafikprozessoreinheiten (GPUs) im Gaming- und professionellen Videospielmarkt bekannt wurde. Mit der Zeit stellten Forscher und Entwickler fest, dass GPUs aufgrund ihrer parallelen Verarbeitungsfähigkeiten hervorragend für Deep Learning und komplexe KI-Aufgaben geeignet sind. Daher hat NVIDIA seine Technologie und Produkte weiterentwickelt, um den wachsenden Bedarf im Bereich KI und maschinellem Lernen zu decken, wodurch das Unternehmen zu einem Schlüsselakteur in diesem Sektor geworden ist.

P

Perplexity

Perplexity ist eine KI-gesteuerte Plattform für Informationsrecherche und -verteilung, die natürliche Sprachanfragen versteht und sofortige Antworten liefert. Sie bietet fundierte Antworten und nutzt Quellen wie Wikipedia. Als schlanke Alternative zu ChatGPT basiert sie auf OpenAI’s API und ist zudem Open-Source, was Flexibilität und Anpassbarkeit ermöglicht.

PowerPoint

Klingt nicht nach Künstlicher Intelligenz, allerdings steckt in der neuen Version dank Microsofts neuem KI-Produkt „Copilot“ sehr viel GenAI drin. Was der Copilot leistet und wieso er für Unternehmen sogar relevanter werden wird als ChatGPT, lesen Sie bei uns im Blog.

Prompten

„Prompten“ bezeichnet den Vorgang, einem Computerprogramm oder speziell einem Language Model eine Eingabeaufforderung (englisch „prompt“) zu geben, um eine bestimmte Antwort oder Aktion zu erhalten. In Bezug auf Language Models wird ein „prompt“ oft als kurzer Text oder eine Frage verwendet, um das Modell dazu zu veranlassen, relevante Informationen oder Antworten zu generieren. Das Eingeben eines Prompts dient als Startschuss für die KI, um ihre Antwort zu formulieren. Prompts können offen, spezifisch, kreativ oder leitend sein, je nachdem, welches Ergebnis der Benutzer erzielen möchte. In vielen Anwendungen von Large Language Models, wie Chatbots oder in der Textgenerierung, sind Prompts ein zentraler Bestandteil der Interaktion.

Podchat.io

Podchat.io ist ein neues nützliches KI-Tool, mit dem man sich ganze Podcastfolgen in einen kurzen Text zusammenfassen lassen kann. Diese Zusammenfassung erhält man dann als Email. Mit der erweiterten, kostenpflichtigen Version von Podchat.io kann man zudem auch Episoden eines Podcasts auf Schlüsselworte durchsuchen.

S

Sprachmodelle

Sprachmodelle sind Datenbanken, die auf großen Mengen von Textdaten trainiert werden, um menschliche Sprache zu verstehen und zu generieren. Sie können Aufgaben wie Textübersetzung, Frage-Antwort-Systeme und Textgenerierung durchführen. Moderne Modelle, wie GPT-4 oder Googles Gemini, basieren auf künstlichen neuronalen Netzwerke, die tatsächlich Strukturen im menschlichen Gehirn gleichen. Die damit verbundene Fähigkeit zur Kombinatorik sorgt für die beeindruckende Genauigkeit und Vielseitigkeit.

Sora

heißt das im Februar 2024 vorgestellte, neue KI-Modell von OpenAI. Als Text-zu-Video-Konverter setzt Sora ganz neue Maßstäbe, wie dieses Video hier zeigt.

U

Urlaub

KI kann auch helfen, wenn man mal nix von der Arbeit wissen möchte – und zwar bei der Planung für den nächsten Urlaub. Es gibt dazu sowohl eigene Tools wie Tripclub als auch KI-Apps im GPT-Store (siehe Blog). Man gibt jeweils nur Reisedaten und -ziel ein und bekommt dann Tipps und Vorschläge zur Reiseroute. Die Ergebnisse sind klassisch GenAI: großteils richtig und als erster Impulsgeber interessant, im Detail muss man aber noch nachbessern.

W

Wettervorhersage

Ersetzt KI jetzt auch die Wettervorhersage? Huawei hat ein neuronales Netzwerk, „Pangu Weather“ geschaffen, das globale Wettervorhersagen für bis zu sieben Tagen und Sechs-Wochen-Forecasts erstellt. Die Genauigkeit soll früheren Modellen entsprechen, dafür ist die Technologie angeblich 10.000 Mal schneller als aktuelle existierende Wettermodelle. (Quelle: Huawei). Die Diagramme auf der Seite des European Centre for Medium-Range Weather Forecasts, das Pangu verwendet, sind zumindest eindrucksvoll.

Z

Zuckerberg, Mark

Erfinder des früher in Westeuropa sehr populären Social Networks Facebook. Im KI-Business war der Facebook-Mutterkonzern Meta, den Zuckerberg leitet, lange überraschend unauffällig. Für Aufsehen sorgte dann seine Ankündigung, das eigene Large Language Model LLaMA unter eine Open-Source-Lizenz zu stellen und damit der Öffentlichkeit einen kostenlosen, freien Zugang zu der KI-Technologie zu gewähren. Ruhig geworden ist es um das Modell „I-JEPA“, das im Sommer 2024 vorgestellt und gefeiert wurde, weil es stärker als bisherige Modelle so lernen sollte, wie Menschen es tun. Für 2024 hat Meta neue Sprachmodelle angekündigt.

Nach oben scrollen