Google Gemini vs. GPT-4: Das sagt das Duell für die Zukunft der KI

Produktvorstellung Google Gemini — Google-Chef Sundar Pichai bei der Vorstellung von Gemini. Namenspatron für das Sprachmodell ist übrigens ein NASA-Raumfahrtprogam. Auf jenes „Gemini“ folgte damals die Mondlandung – im KI-Kosmos dürfte es ähnlich rasant weitergehen. Foto: Google

Wer ist im Goldrausch der USA Mitte des 19. Jahrhunderts wirklich reich geworden? Nicht die Goldgräber, sondern die Verkäufer von Hacken und Schaufeln, die Vermieter von Transportmitteln und Unterkünften. Kurzgesagt: Diejenigen, die sich um die Infrastruktur gekümmert haben. Genau diesen Weg beschreitet jetzt auch Google mit seinem in dieser Woche vorgestellten Sprachmodell Gemini.

Google Gemini vs. GPT-4 von OpenAI – was das Duell über die Zukunft von Generativer KI sagt

Damit zeigt der Konzern, wo er sich sieht im aktuellen KI-Rausch: Google liefert ebenfalls die Infrastruktur und wählt damit das Geschäftsmodell, das das bessere Chance-Risiko-Profil bietet. Warum, zeigt der Goldrausch: Ohne Schaufel ging niemand zum Graben, ohne Gold hingegen kamen viele wieder nach Hause …

Gemini, benannt übrigens nach einem sehr erfolgreichen US-Raumfahrtprogramm der 60er, stellt hauptsächlich eine Infrastrukturkomponente dar, die Basistechnologie für die nächste Stufe der Verbreitung von Generativer Künstlicher Intelligenz (GenAI): Es ist ein multimodales Large Language Model, das verschiedene Informationen wie Text, Video, Audio, Bilder und Computersprache verstehen und verarbeiten kann – auch dann, wenn wir unterschiedliche Kategorien bei der Eingabe mischen. Insofern tritt Gemini auch nicht, wie oft zu lesen, als ChatGPT-Wettbewerber an, sondern konkurriert mit der dem Chatbot zugrundeliegenden Technologie, dem Sprachmodell GPT-4.

Wie leistungsfähig das Modell sein soll, zeigt dieser Demo-Video von Google. „Sein soll“, weil der Konzern nach der Präsentation zugeben musste, dass er manche Szenen so geschnitten hatte, dass Gemini etwas besser wegkommt. Dennoch ist beeindruckend, dass die KI offenbar auf alle Alltagsfragen plausible Antworten findet:

Da Gemini das technologische Fundament darstellt, stellte Google nicht nur die Technologie selbst vor, sondern erklärte auch gleich, wo überall sie zum Einsatz kommt: im eigenen Chatbot Bard natürlich, aber auch in Google-Handys, im Webbrowser Chrome und anderen Google-Diensten. Gerade für Bard ist das eine gute Nachricht, mag man süffisant anmerken, da der Bot bislang ja eher denkschwach und sprachlich unbeholfen daher kam.

Auch mit Gemini wird er allerdings diverse Dinge nicht können, die ChatGPT längst beherrscht – etwa Bilder zu erstellen. Diese Funktion hatte Google zwar schon im Mai angekündigt, aber mangels Priorität nicht weiter verfolgt. Bard hat für Google eben nicht die Bedeutung, die ein ChatGPT für OpenAI hat.

Gemini wird der neue Datenlieferant für Google

Interessanter sind daher auch zwei andere Ankündigungen, die Google gemacht hat:

Dass es drei Ausbaustufen des neuen Sprachmodells gibt – Gemini Pro als Basisversion, Gemini Nano, das speziell auf Mobilgeräte zugeschnitten sein soll, und das leistungsfähigste Modell Gemini Ultra, das – laut Google – GPT-4 in einigen Bereichen überlegen sein soll, aber auch erst als letztes 2024 in den Markt kommen wird. Das zeigt, wo Googles Fokus liegt: darin, die eigene KI in allen Bereichen der Tech-Welt unterzubringen, um über die maximale Marktdurchdringung den Wettbewerb wieder einmal abzuhängen.
Professionelle Entwickler und IT-Tüftler sollen sehr schnell Zugang zu Gemini Pro erhalten – die entsprechende Schnittstelle möchte Google noch im Dezember freischalten. Damit sorgt Google wieder einmal dafür, dass ein Produkt sich von selbst verbreitet, weil andere die Arbeit übernehmen. „Owned Reach“ würde man das im Marketingsprech nennen. Mit vielen anderen Tools, von Google Maps bis zum Keyword Planer, hat der Konzern es genauso gemacht – und lässt sich seine „Gratisgabe“ mit der wichtigsten Währung im digitalen Zeitalter bezahlen: Daten. Gemini wird nun der neue Datenlieferant für Google.

Was Google Gemini und Microsofts Copilot gemeinsam haben

Es ist klug von Google, diesen Weg zu gehen, um erfolgreich mit OpenAI zu konkurrieren. Denn die Firma von (Inzwischen-ja-wieder)-CEO Sam Altmann hat einen großen Vorteil: Da ChatGPT schon seit über einem Jahr am Markt ist und inzwischen mehr als 1,6 Milliarden monatliche Nutzer hat, hat OpenAI sehr viele Nutzungsdaten und zudem sein Language Model GPT-4 sukzessive durch User-Eingaben weiterentwickeln können.

Wir alle trainieren mit jedem Prompt die entsprechende Software, und ChatGPT ist seit November 2022 quasi im Dauertrainingslager. Längst haben weltweiten Nutzer mehr Daten eingegeben, als die Entwickler selbst in das Sprachmodell eingepflegt hatten.

Um diesen Nachteil auszugleichen, braucht Google andere Kontaktpunkte als Bard, und mit der Implementierung von Gemini in Plattformen und Devices weltweit möchte es genau diese Herausforderung lösen. Insofern erscheint auch recht einfach absehbar, was als nächstes kommen könnte: Gemini Pro in YouTube oder Gemini Nano in Android, dem weltweit führenden Smartphone-Betriebssystem.

Und für Firmenkunden, die die Google Enterprise-Suite nutzen, wird Gemini Ultra als kostenpflichtiges Zusatzmodul kommen – so wie Microsoft es mit seinem „Copilot“ macht. Auch seine eigene KI-Applikation Copilot hat Microsoft bewusst nicht als Stand-Alone-Tool entwickelt – der Konzern weiß, dass er viel mehr profitieren wird, wenn er die neue Technologie nutzt, um seine stärksten Produkte noch besser zu machen und die Begehrlichkeit des neuen Windows 11 für Unternehmen steigert.

Warum Google im Frühjahr Bard so gehetzt auf den Markt geworfen hat

Im ersten Halbjahr hatten noch viele GenAI-Experten darüber gefrotzelt, dass Google so sehr im Hintertreffen sei gegenüber den KI-Startups, weil Bard so schwach sei. Was sie übersehen haben: Bard war immer nur als ein KI-Vehikel unter vielen gedacht, und vermutlich notgedrungen auch als Beruhigungspille für die Investoren, die Firmen wie OpenAI, Perplexity oder den Claude2-Entwickler Anthropic enteilen sahen.

Letzteres war vermutlich auch der Grund, wieso Google – untypisch für den Konzern – im Frühjahr so hastig mit dem unausgereiften Bard um die Ecke gekommen war. Bard ist eben – um im Bild vom Anfang zu bleiben – nicht die Schaufel oder die Hacke, die jeder benötigt.

Das Wettrennen der GenAI-Chatbots hat Google daher nie ernsthaft interessiert – denn langfristig werden sich vermutlich nur ein oder zwei dieser Bots weltweit, und damit in einer Größenordnung, die für Google relevant ist, durchsetzen. Und bei diesem Wettrennen mitzumischen, hätte bedeutet, sich unter die Goldgräber zu begeben.