So erstellt man mit Sora professionelle KI-Videos (und inzwischen auch Bilder)

Aktualisiert: 31. März 2025

Screenshot Sora Video, Katze am Heldenplatz in Wien
Was es mit dieser Katze auf sich hat, das lesen Sie weiter unten …

So gut ist Sora, die neue Video-KI von OpenAI

Die Ankündigung war einer der KI-Wow-Momente des Jahres 2024 – nur: Nach der Ankündigung folgte zunächst nichts Neues. Die Rede ist von der Video-KI Sora, die OpenAI im vergangenen Februar vorstellte. Auf Basis einfacher Text-Prompts sollten fotorealistische Videos entstehen – Videos wie dieser Clip einer Frau, die durch die Straßen von Tokio flaniert, gingen viral.

Nur: Selbst nutzen konnte man Sora sehr lange nicht. Seit Dezember ist das Tool für Abonnent:innen der kostenpflichtigen Versionen von ChatGPT verfügbar. Wie bei vielen KI-Innovationen galt dies zunächst nicht für Nutzer:innen in der EU, die nur per VPN und einem fingierten Standort in den USA oder Kanada zugreifen konnten. Erst Anfang März wurde diese Begrenzung aufgehoben, sodass Sora nun auch in Deutschland, Österreich und dem Rest der EU nutzbar ist.

So ist Sora aufgebaut

Sora ist ein Tool der ChatGPT-Entwicklerfirma OpenAI. Anfangs nur für Videos vorgesehen, kann es seit Ende März 2025 auch Bilder generieren. Die Benutzeroberfläche ist der von ChatGPT ähnlich, beginnend mit der Navigationsleiste auf der linken Seite und dem Eingabeschlitz am unteren Rand, in dem man seinen Prompt eingibt:

Sora-Interface

Die bisher generierten eigenen Videos und Bilder erscheinen darüber im Hintergrund. Über die Navigation links kann man andere Inhalte durchsuchen, eigene sortieren, Favoriten aufrufen und einiges mehr. 

Sora für Einsteiger

Da die Bildergenerierung inzwischen weit verbreitet und bekannt ist, beschränken wir uns im Folgenden darauf, die Video-Features zu erklären. Die einfachste Methode, in Sora Videos zu erstellen, funktioniert per Text-Prompt. Tipp: Wir machen gute Erfahrungen damit, ChatGPT die Video-Prompts schreiben zu lassen – so wie wir es auch schon bei Bild-KI-Tools wie Midjourney tun. Richtig gute Ergebnisse liefert das frei verfügbare CustomGPT „Sora Video Prompter“.

Neben dem Prompt kann man über die Buttons darunter noch einige Spezifikationen festlegen

  • Auflösung (max. 720 px – für Pro-Nutzer bis zu 1080 px)
  • Format (9×16, quadratisch oder 16×9)
  • Länge (5 oder 10 Sekunden). Oft liest man, es seien nur fünf Sekunden möglich, aber OpenAI hat das Limit längst angepasst. Pro-Nutzer können sogar bis zu 20 Sekunden lange (oder eher „kurze“?) Clips erstellen.
  • Anzahl der Varianten, die Sora erstellen soll (1 oder 2, Pro-Accounts bis zu 4).

Die Videoerstellung dauert etwa 30 Sekunden, wenn man die reduzierte Auflösung von 480 px wählt. Bei 720 px wartet man etwa viermal so lange.

Das neue Video findet man, indem man rechts oben auf das Glockensymbol klickt oder links auf „Alle Videos“ klickt. Sie können eigene Videos herunterladen, als Plus- oder Teams-Nutzer allerdings nur mit Sora-Wasserzeichen. Zumindest ist das nur sehr klein unten rechts zu sehen, wie man bei diesem Katzen-Spaziergang auf dem fiktiven Wiener Heldenplatz erkennt:

Sora für Fortgeschrittene

Die fünf hilfreichsten Funktionen in Sora für Fortgeschrittene sind:

  1. Content-Upload: Über das Plus-Symbol unten links im Chat-Fenster kann man eigene Bilder oder sogar Videos hochladen und diese als Basis für den neuen Clip nutzen.
  2. Storyboard: Indem Sie ein Storyboard erstellen, können Sie ein Video mit mehreren Szenen erstellen. Jede Szene hat eine Karte auf einer Zeitleiste, auf der Sie sie mit Text beschreiben oder dort ein Video oder ein Bild hochladen. Indem Sie die einzelnen Karten auf der Leiste verschieben, verkürzen oder verlängern Sie die Szenen. Lassen Sie zwischen den Karten immer etwas Platz, damit die KI die Szenen sinnvoll miteinander verbinden kann. Sonst gibt es Bildsprünge.
  3. Video bearbeiten: Sora bietet verschiedene Möglichkeiten zur Bearbeitung. Beim Remixen lassen Sie die KI ein neues Video erstellen und können ihr dazu im Prompt passende ergänzende Anweisungen mitgeben. Beim Recut trimmen Sie den Clip, und beim Blenden mischen Sie ihn mit einem anderen Bild oder Video zusammen.
  4. Loopen: Machen Sie aus Ihrem Kurzvideo einen Endlosclip. Das Loopen funktioniert, so unsere Erfahrung, bisher allerdings nur selten wirklich gut – oft „halluziniert“ Sora hier Elemente in den Übergang oder baut Glitches ein, die im Video nichts verloren haben.
  5. vorgefertigte Presets – die Videos einen bestimmten Look geben – etwa Pixel Art oder Film Noir.

Bild-zu-Video: in drei Schritten zum tanzenden Roboter

Unser Lieblings-Case ist dieser Roboter: Basierend auf diesem Midjourney-Bild haben wir in drei Schritten daraus ein Endlosvideo erstellt, in dem die Blechbüchse von der Treppe hopst, im Konfetti tanzt und anschließend wieder auf die Treppe zurückspringt.

So sind wir vorgegangen:

  1. zwei Videos über leicht unterschiedliche Textprompts aus ChatGPT erstellen
  2. diese beiden über Soras Blending-Funktion mischen
  3. anschließend das Ergebnis loopen. Macht zumindest schon mal gute Laune, sehen Sie selbst:
Direkt in YouTube läuft das Video als Short übrigens auch als Endlosschleife.

Sora hat die gleichen Mankos wie so viele KI-Tools

Sora mag in puncto Videoerstellung beeindruckend sein. Allerdings hat das Tool die gleichen Schwächen wie so viele KI-Werkzeuge:

  1. Auch Sora halluziniert und erfindet immer wieder Details, die der Realität widersprechen. Das fällt sofort auf, wenn man reale Bilder nachempfindet. Unsere Katze vom Wiener Opernplatz beispielsweise läuft in dem Minivideo scheinbar vor der Hofburg entlang, nur dass deren Fassade in Wirklichkeit keineswegs geschwungen ist, sondern schnurgerade verläuft. Typisch KI eben: Jedes Detail, das wir nicht vorgeben, denken sich die Tools selbst aus.
  2. Auch Video-KI ist massiv biased, produziert also Bilder, so wie es ihrem Inputmaterial entsprechend angemessen zu sein scheint. Wie auch in anderen Anwendungsfällen von Künstler Intelligenz fällt uns das oft gar nicht so sehr auf. Nehmen Sie dieses Sora-Video. Der Prompt lautete: „Flight over the Rhine river on a sunny afternoon. Photorealistic“.
    Wir haben drei Videos auf Basis dieses Prompts generiert – die Sequenz unten ist eine davon –, dreimal erschien im Vordergrund eine historische Burg in sommerlichem Ambiente. Weder ist am Rhein immer Sommer, noch ist der Flusslauf überwiegend mit historischen Festungen gesäumt. Das Bild entspricht aber einem amerikanischen Klischee, wie es wohl am Rhein aussehe – und vermutlich gibt es im Trainingsmaterial von Sora, das überwiegend aus US-Bilddatenbanken schöpft, überdurchschnittlich viele solcher pittoresker Ansichten. Künstliche Intelligenz zeigt also kein ausgewogenes Bild der Welt, sondern zeigt sie uns so, wie ihr Datenmaterial es hergibt.

Das kostet die Sora-Nutzung

Sora ist für zahlende ChatGPT-Nutzer:innen kostenlos. Bis zum großen Sora-Update Ende März verbrauchte jedes Generieren oder Remixen einen Teil monatlich verfügbarer Credits. Pro-Nutzer hatten ein deutlich höheres Budget. Plus- und Team-User konnten zudem nicht nachkaufen, daher galt bis dato: War das Budget aufgebraucht, mussten sie bis zum nächsten Abbuchungstermin der ChatGPT-Abokosten warten. Dann lud Sora das Budget wieder auf.

Seit Ende März ist die Credit-Regelung passé: ChatGPT Pro und Plus-Pläne bieten unbegrenzten Zugang zu Sora, solange man die Nutzungsbedingungen einhält und nicht etwa anfängt, (teil)automatisiert große Mengen an Content zu erstellen.

Während also bis März zur professionelleren Videoerstellung ChatGPT Pro tatsächlich ein Gewinn war war, hat sich dies gewandelt: Wer keine hochauflösenden Clips braucht, ist mit dem Plus-Plan gut ausgestattet.

Fazit: Noch ist es eine Spielerei, aber das sollte nicht täuschen 

Erster Eindruck: Aufgrund der Kürze und der geringen Auflösung sind Sora-Videos bisher nur eine nette Spielerei. Manche Clips schauen bemerkenswert echt aus wie unsere Katze auf dem Heldenplatz, in anderen fliegt das Pferd, das eigentlich die Kutsche ziehen sollte, plötzlich davon …  

Aber: Viele KI-Innovationen, die anfangs nur „nette Spielereien“ waren, haben sich sehr schnell als wegweisend erwiesen. Google hat mit „Veo 2“ bereits ein eigenes Video-Tool angekündigt, das Sora ebenbürtig sein soll. Und wenn man den führenden US-Techblogs vertraut, dann wird Video-KI in diesem Jahr so gut, dass sie sich auch für professionelle Anwendungen eignet. 

Bildquelle: Sora/disruptive

Nach oben scrollen