Header Visual für den Blogartikel rund um den ChatGPT Agent

ChatGPT Agent im Test – die neue Super-KI macht sich selbstständig

Stellen Sie sich vor, Ihr wichtigster IT-Dienstleister präsentiert ein neues Produktfeature, und das Erste, was der CEO tut, ist, öffentlichkeitswirksam via Social Media vor dessen Nutzung zu warnen.

So passiert dieser Tage bei OpenAI zum Start der neuen ChatGPT-Funktion namens Agent. Seit dem Wochenende ist die Funktion auch in Deutschland, Österreich und der Schweiz verfügbar.

Mehr KI-Updates gefällig?

In unserem monatlichen Newsletter erhalten Sie alle relevanten Updates zu GenAI – mit Fokus auf Kommunikation, Marketing und HR.

ChatGPT Agent markiert den Übergang vom smarten Chatbot zum selbstständig agierenden digitalen Kollegen. Wählt man die Funktion „Agent Mode“ aus (im Dropdown unter „Tools“), startet ChatGPT einen eigenen virtuellen Computer und arbeitet damit eigenständig Aufgaben Schritt für Schritt ab. Man kann ihm dabei sogar live zusehen.

Der virtuelle Desktop von ChatGPT Agent

Die Aufgaben können komplexe Recherchen sein, die Organisation von Terminen und Datenanalysen. Das Tool kann sogar eigenständig Dokumente erzeugen, darunter Excel‑Tabellen und PowerPoint-Präsentationen – letztere allerdings leider weiterhin nicht markenkonform.

Eigentlich ein Grund zum Feiern für den marketingbewussten OpenAI-CEO Sam Altman. Statt dessen warnt er in einem Post auf X: „Böswillige Akteure könnten versuchen, die AI Agents der Nutzer auszutricksen, damit sie private Informationen preisgeben, und Aktionen durchführen, die sie nicht durchführen sollten, und zwar auf eine Weise, die wir nicht vorhersagen können.“

Bereits in der Vergangenheit hatte der OpenAI-Chef über die Risiken von KI gesprochen; doch so kritisch hatte er sich bisher noch nie über eigene Produkte geäußert. Warum seine Firma Agent dennoch freigeschaltet hat? „Um es in der freien Wildbahn zu untersuchen und zu verbessern.“ OpenAI habe zahlreiche Sicherheitsvorkehrungen und Warnungen eingebaut, so Altman: „Wir können jedoch nicht alles vorhersehen.“

ChatGPT Agent-Fail: Ist unberechenbar die Steigerung von selbständig?

Ob seine Experten auch nicht vorhergesehen haben, dass sich ChatGPT Agent selbständig macht? Denn genau das ist bei unserem ersten Test direkt passiert.

Wir waren für einen KI-Workshop bei einem österreichischen Kunden in Linz und wollten die KI den gemütlichen Teil organisieren lassen:

ChatGPT Agent Mode. Der Prompt: „Suche mir zum Mittagessen heute in Linz ein gutes Restaurant für 15 Personen, berechne die Wegzeit zu Fuß von der Domgasse 5 und frage einen Tisch an. Empfiehl mir auf Basis von Nutzerbewertungen außerdem drei Gerichte, damit ich unsere Gruppe gut beraten kann.”

Hier der gesamte Thread. Der Agent startete wie geplant, fand ein nahe gelegenes Restaurant und lieferte auch Tipps zu Bestellungen. Dann fragte er nach den Kontaktdaten (in diesem Fall Name, Handynummer und Mail) und gab den Hinweis: „Den finalen Schritt (Bestätigung der Reservierung) führe ich erst nach deiner ausdrücklichen Bestätigung aus.“

Ein Screenshot mit einer Antwort von ChatGPT

Der KI-Bot traf also entgegen der eigenen Ansage unabgestimmte Entscheidungen und das sogar außerhalb von ChatGPT und in direktem Kontakt mit Dritten. Dadurch, dass das Lokal seiner Wahl über ein Mail-Formular auf der Website verfügte, reichten ihm die wenigen Daten, um ohne menschliche Freigabe eine Reservierung auszulösen.

Tatsächlich hatten wir Sekunden später eine automatische Bestätigungsmail des Restaurants im Postfach.

In diesem Fall stellte das kein echtes Problem dar, wir hätten sofort stornieren können. Allerdings bestätigt es, was Altman schrieb: „Die potenziellen Risiken sind beträchtlich.“ Unberechenbar ist die Steigerung von selbstständig.

So nutzen Sie ChatGPT Agent sicher

Insofern unsere klare Empfehlung: So verlockend es ist, der KI beim Arbeiten zuzusehen: Füttern Sie ChatGPT Agent auf keinen Fall mit vertraulichen Angaben, Personen- oder Kommunikationsdaten. Seien Sie skeptisch, was Zusagen der KI angeht: Die von Altman versprochenen Sicherheitsvorkehrungen reichen aktuell noch nicht aus.

In einem anderen Case haben wir die KI ausdrücklich gebeten, sich vor dem selbständigen Lösen gewisser Aufgaben bei uns rückzuversichern. Auch an diese Vorgabe hielt sie sich nur in zwei von drei Fällen.

Dennoch: Um einen Blick in die Zukunft der KI zu werfen, bietet sich das neue Tool auf jeden Fall an. Denn die Fähigkeiten von ChatGPT Agent,⁠ mit Websites zu interagieren, komplexe Informationen zu synthetisieren und das mit dem Verständnis und der sprachlichen Gewandtheit eines Chatbots zu verbinden, markieren tatsächlich einen Meilenstein in der KI-Entwicklung.

Drei Gründe für die disruptive KI-Akademie

Sofort nutzbares Praxiswissen und wöchentlich neue Kurse
DSGVO-konform und ISO-zertifiziert

Plattform in Ihrem Corporate Design

Die Use Cases sind fast unbegrenzt. Beeindruckend war beispielsweise die erste OpenAI-Demo mit Sam Altman zur Vorbereitung einer Hochzeit: Kauf eines Outfits, Buchung einer Reise, Auswahl eines Geschenks… Beim „Humanity’s Last Exam“, kurz HLE, einem Test mit 2500 komplexen Aufgaben aus Mathematik, Informatik, Natur- und Geisteswissenschaften, konnte der Agent 50 Prozent mehr Aufgaben lösen als die bisher besten Vorgänger. Weitere Cases aus der Arbeitswelt hat der Techblog ZDnet durchgespielt und dabei auch die Grenzen der KI aufgezeigt.

Agentic AI, also Bots, die selbständig und unter Zugriff auf diverse Tools Probleme lösen, ist der nächste große Schritt auf dem Weg der KI-Disruption. Auf der Consumer Electronics Show (CES) im Januar hatte Nvidia-CEO Jensen Huang gar das „Age of AI Agents“ ausgerufen und das eigene IT-Department zur „Personalabteilung für die Entwicklung von KI-Agenten“ erklärt.

Aber es geht hier nicht nur um die BigTechs: Gerade mittelständische Firmen, die unter Fachkräftemangel leiden, werden von KI-Agenten profitieren.

Zugleich befinden wir uns an einem Punkt, wo KI erkennbar so leistungsfähig geworden ist, dass jede Weiterentwicklung auch erhebliche Risiken mit sich bringt. Das viel zitierte Forschungsprojekt „AI 2027“ hat neulich erst beschrieben, was passiert, wenn die Welt Schritt für Schritt auf sogenannte Agentic AI zusteuert. Der aktuelle Beitrag dazu in der ZEIT ist sehr lesenswert.

Im vergangenen Winter haben wir noch gelächelt über die ersten Agents wie „Computer Use“ von Claude, die sich ständig selbst aufgehängt haben wie alte MS-DOS-Programme. Sechs Monate später hat sich das Genre zum Serienprodukt entwickelt. Allerdings bisher noch nicht mit der nötigen Serienreife.

Bildquelle: Midjourney/disruptive

Nach oben scrollen