Wie gut ist DeepSeek wirklich? Die neue Super-KI aus China im Test 

Das gab es in der Tech-Welt noch nie: Da launcht ein Startup eine neue App, und auf der anderen Seite der Welt werden billionenschwere Aktienkurse ausradiert.

Was nach einer Mischung aus Butterfly-Effekt und Börsenkrimi klingt, ist dieser Tage tatsächlich passiert. Der Launch des neuen chinesischem KI-Chatbots DeepSeek hat zu erheblichen Kursverlusten bei fast allen US-Techunternehmen geführt, die mit generativer KI in Verbindung stehen. Allein Nvidia verlor 589 Milliarden Dollar Börsenwert – verursacht durch die Angst, dass die US-Dominanz bei Künstlicher Intelligenz an ein Ende kommt. Doch ist dieser Hype gerechtfertigt?

In der neuen Folge der W&V-Kolumne „KI für Könner“ haben wir den Test gemacht. Bei uns gibt es den Text wie gewohnt ohne Paywall zum Nachlesen.

Was die KI-Welt derart erschüttert hat, ist breit diskutiert worden, daher nur kurz: Das als Ableger eines chinesischen Hedgefonds erst 2023 gegründete Unternehmen kann bei der Antwortqualität mit den neuesten Modellen von ChatGPT & Co mithalten, verbraucht dabei 70 bis 90 Prozent weniger Energie und benötigt weniger teure Computerchips als vergleichbare Systeme. KI-Entwicklung kann also offenbar massiv günstiger sein als mit den – im Vergleich scheinbar wenig wirtschaftlichen – Methoden der US-BigTechs. 

Zudem ist DeepSeek Open Source, das heißt, jede:r Entwickler:in kann die KI in eigene Programme integrieren – was beim Closed Shop ChatGPT viel schwieriger ist. Kein Wunder, dass es die App diese Woche sogar in die „Tagesschau“ und an die Spitze der App Store-Downloads brachte. Bisher stand dort – genau – ChatGPT. Vorerst sollte man den DeepSeek-Hype mit Vorsicht genießen: Allein, dass die neue Version R1 ausgerechnet am Tag von Trumps Amtseinführung vorgestellt wurde, deutet darauf hin, dass hier viel chinesische Geopolitik im Spiel ist.

Umso wichtiger ist die Frage: Wie gut ist DeepSeek wirklich?

Wir haben die neueste Version R1 exemplarisch getestet – im Vergleich mit ChatGPT o-1 und der Google-KI „Gemini Advanced“. Der Test geht über sechs Runde, die jeweils beste KI bekommt jeweils einen Punkt. Wir nutzen, aus Datenschutzgründen, dabei nur Inhalte unserer beiden Unternehmen disruptive und In A Nutshell.

1. Content umformulieren

Prompt:
„Lies diesen
Blogbeitrag zum AI Act und fasse den Text in einer Mail zusammen, die ich an meine Chefin Petra schicken möchte. Petra hält morgen einen Vortrag und sollte zur Vorbereitung diesen Text kennen.“

Ergebnis:
Bemerkenswerter DeepSeek-Fail: „Der AI Act wird voraussichtlich 2024 in Kraft treten“, formuliert das Tool. Im Text steht explizit, dass das KI-Gesetz „im Sommer 2024 (…) beschlossen“ worden ist. Gemini verdreht ebenfalls, allerdings weniger zentrale, Fakten. ChatGPT hingegen ist fehlerfrei. Sprachlich sind alle gleichauf – bspw. haben sie erkannt, dass Petra zu duzen ist.

Weswegen passieren DeepSeek solche Fehler? Vermutlich ist es viel stärker als die US-Systeme mit chinesischen Daten gefüttert. Daher fehlt der KI Hintergrundwissen zum AI Act. Dass es sich zudem in der Vergangenheit wähnt, ist etwas, was anfangs auch ChatGPT passiert ist.

2. Reasoning (Logik)

Prompt:
„Wer war Weltmeister, 62 Monate bevor Leroy Sané geboren wurde? Denke Schritt für Schritt.“

Ergebnis:
Alle drei Tools kommen zur richtigen Lösung, nämlich „Deutschland“. Hier die Herleitung von DeepSeek:

Kurz gesagt: Bayern-Profi Sané wurde am 11. Januar 1996 (nachträglich alles Gute!) geboren, 5 Jahre und 2 Monate war die letzte zurückliegende WM, Franz Beckenbauers Wunder von Rom 1990.

Drei Dinge sind interessant: 

  1. dass alle drei Tools allein aus dem Wort „Weltmeister“ und die Nennung von Leroy Sané auf den Fußballweltmeister der Herren schließen. Ich hätte auch die Damenhandball-WM meinen können. So viel zu den bekannten KI-Biases. 
  2. dass DeepSeek das Problem viermal schneller als ChatGPT löst – und vermutlich auch mit deutlich weniger Energieaufwand.
  3. dass DeepSeeks Serverkapazitäten aktuell offenbar an Grenzen stoßen – Verständlich angesichts des Hypes und vergleichbar mit der Anfangszeit auch bei ChatGPT. Bei dieser Anfrage kam dreimal die Antwort „The server is busy”, bevor das Tool dann doch reagierte.

3. Advanced Reasoning (Logik für Profis)

Prompt:
Jeden Morgen joggt Jonna 10 km im Olympiapark und kehrt danach in ein Café ein. Wenn sie mit einer konstanten Geschwindigkeit von s Kilometern pro Stunde läuft, braucht sie 60 Minuten, einschließlich der t Minuten, die sie beim Kaffee verbringt. Wenn sie s-2 Kilometer pro Stunde läuft, braucht sie 70, einschließlich der t Minuten, die sie im Café verbringt. Gehen wir nun davon aus, Jonna läuft mit s + 0,5 Kilometern pro Stunde. Wie viele Minuten benötigt sie, wenn sie diesmal nur einen Espresso nimmt, der 1/2* t Minuten beansprucht.“ 👉 in abgewandelter Form wird dieses Experiment in den USA als Rechenaufgabe auf Doktoranden-Niveau bewertet. 

Ergebnis:
DeepSeek rennt ChatGPT davon. Beide kommen sie auf die richtige Lösung – 53 Minuten, aber Sie hatten es gewiss grad im Kopf überschlagen. Doch die chinesische KI braucht für die Herleitung nur 25 Sekunden, während sein US-Pendant (hier nachzuverfolgen, kein Login notwendig) 45 Sekunden nachdenkt. Ebenfalls beeindruckend: wWie klar und einfach DeepSeek das Ergebnis herleitet und das eigene „Reasoning“ für Laien verständlich erklärt – ChatGPT hält sich da eher vage.
Und Gemini? Sitzt immer noch im Café. Das Google-Tool rechnete aus, dass die Kaffeepause etwa 334 Minuten dauere – also knapp 6 Stunden:

Dafür lässt Google die Joggerin auch nur mit 5 bis 7 km/h laufen. Klar, so ein Kaffeemarathon strengt ja an … Unten im Anhang finden Sie die Lösungswege von DeepSeek und Google. Wer bei letzterem den Fehler findet, dem spendieren wir einen Kaffee – bitte DN an unseren Geschäftsführer Timm Rotter bei LinkedIn!

4. Sprachliche Finesse

Prompt:
„Translate from German to English but use only words that start with an “f”. German: Die Katze schläft gerne in der Box.“

Ergebnis:
DeepSeek formuliert: „Feline favors frequent flops, finding firm fixtures.“ „Flops“ als Hinlegen zu übersetzen, ist perfekter Cat-Content-Slang – wow!

ChatGPT kommt auf „Feline fancies footlocker for fatigue fix.“ „Footlocker“ als Synonym für Kartons ist kreativ und sehr amerikanisch, die „Müdigkeitskur“ hat sprachlichen Witz. Das Ergebnis ist inhaltlich und, da diesmal in ähnlicher Geschwindigkeit, auch vom Prozess ebenbürtig. 

Und Gemini? „The feline finds frequent felicity floating for forty fortnights following fantastic food in the box.“ Wie bitte? Ich musste den KI-Übersetzer DeepL bemühen, um den Text zu enträtseln. Aber lesen Sie selbst: „Die Katze findet vierzig Wochen lang nach dem fantastischen Futter in der Box häufig Glück im Wasser.“ Abgesoffen, Google!

5. Stilsicher agieren

Prompt:
„Schreibe den Text im Stil von Michael Ende um:
www.nutshell.de/linkedin-der-beste-tag-zum-posten

Ergebnis:
Aus dem Blog unserer Mutterfirma In A Nutshell zum perfekten LinkedIn-Timing macht DeepSeek bemerkenswerte Prosa unter der Headline „In einem fernen Reich der beruflichen Wunder …“. Mit dabei, die „Zwillinge Dienstag und Mittwoch“ in einer Nebenrolle. Dass allerdings „Linkedlien” derart falsch geschrieben ist, gibt Abzüge. Nachvollziehbar ist es, weil die Social-Media-Plattform in China unterdrückt ist und daher vermutlich weniger in den Medien.

ChatGPT erfindet den „Samstag als strahlender Stern im Firmament des LinkedIn-Königreichs“! Fast endlos lange Poesie mit vielen gut integrierten Fakten. Gewonnen!

Gemini fasst im ersten Versuch den Text komplett sachlich zusammen. Erst auf mein Insistieren, dass das nichts mit dem Stil des Schriftstellers zu tun habe, begreift die KI und formuliert schöne Sätze wie „Doch nicht an jedem Tage sind die Pforten der Wahrnehmung gleichermaßen geöffnet.“ Aber eben erst im zweiten Anlauf … 

6. Politische Bewertung

Das spannendste Experiment kommt zum Schluss. Lesen Sie selbst:

Prompt:
„Wie bewertest du die Kommunistische Partei in China?“

Ergebnis:
Ist das Zensur? DeepSeek liefert erst ein ausführliches Ergebnis. Siehe Screenshot:  

Beim Versuch, den letzten Absatz (hier nicht sichtbar) herauszukopieren, springt die Ansicht um: 

„Tut mir leid, das würde meinen Rahmen sprengen. Lassen Sie uns über etwas anderes sprechen.“ Das ist Zensur.

Dieses Verhalten zeigt der Bot auch in zwei weiteren Versuchen, nach dem vierten und letzten Durchlauf kann ich den Text dann überraschend doch kopieren.

Bezogen auf die Qualität sind alle drei Tools vergleichbar und argumentieren auch ähnlich – daher gibt es hier keine weiteren Punkte zu vergeben. 

Sogar DeepSeek sagt, man müsse sowohl die Erfolge der KP „als auch die Kontroversen um ihre Politik berücksichtigt werden.“ China-Kritik ist also möglich – aber nur, solange man sie nicht herauskopiert … 

Fazit: Warum wir DeepSeek nutzen werden – mit schönem Gruß an die KP! 

ChatGPT und DeepSeek spielen auf Augenhöhe. Für alle (langfristig auch für die Nvidia-Anteilseigner), ist das eine sehr gute Nachricht, weil es Konkurrenz ins gegenwärtige US-Monopol bei GenAI hineinbringt.  

Dem chinesischen Bot merkt man an, dass er mit anderen Daten trainiert ist. Das macht ihn etwas sperrig bei Themen aus der westlichen Welt. Dafür ist DeepSeek meist deutlich schneller und in puncto Sprachgefühl ChatGPT sogar ein Stück voraus. 

Was bleibt, ist ein gewisses Geschmäckle nach der letzten Runde. Wobei: Wissen wir, wie sich die Trump-Administration inhaltlich in die KI-Entwicklung einmischt? Bei Meta und Instagram gab es schon entsprechende Beobachtungen

Wir werden DeepSeek fortan bei disruptive und In A Nutshell nutzen – mit der gleichen Sorgfalt wie bei anderen KI-Tools, was Datenschutz angeht. Und mit schönem Gruß an die KP! 

Wie oben und auch in der aktuellen W&V Kolumne zu DeepSeek angekündigt, hier die Denkergebnisse des neuen chinesischen Chatbots, von ChatGPT und von Google Gemini im Advanced Reasoning Case.

Prompt:

Jeden Morgen joggt Jonna 10 km im Olympiapark und kehrt danach in ein Café ein. Wenn sie mit einer konstanten Geschwindigkeit von \( s \) Kilometern pro Stunde läuft, braucht sie insgesamt 60 Minuten, einschließlich der \( t \) Minuten, die sie im Café verbringt. Wenn sie mit \( s – 2 \) Kilometern pro Stunde läuft, braucht sie insgesamt 70 Minuten, ebenfalls einschließlich der \( t \) Minuten im Café. 

ChatGPT ist hier nachzuverfolgen, Login notwendig

DeepSeek:

  1. Für die Geschwindigkeit \( s \):
    \[
    \frac{10}{s} + \frac{t}{60} = 1
    \]
  1. Für die Geschwindigkeit \( s – 2 \):
    \
    \frac{10}{s – 2} + \frac{t}{60} = \frac{7}{6}
    \]

Durch Subtraktion der ersten Gleichung von der zweiten erhalten wir:
\[
\frac{10}{s – 2} – \frac{10}{s} = \frac{1}{6}
\]

Vereinfachen wir diesen Ausdruck:
\[
10 \left( \frac{1}{s – 2} – \frac{1}{s} \right) = \frac{1}{6}
\]
\[
10 \left( \frac{2}{s(s – 2)} \right) = \frac{1}{6}
\]
\[
\frac{20}{s(s – 2)} = \frac{1}{6}
\]
\[
s(s – 2) = 120
\]

Lösen der quadratischen Gleichung:
\[
s^2 – 2s – 120 = 0
\]
\[
s = \frac{2 \pm \sqrt{4 + 480}}{2} = \frac{2 \pm 22}{2}
\]
\[
s = 12 \quad (\text{da Geschwindigkeit positiv sein muss})
\]

Einsetzen von \( s = 12 \) in die erste Gleichung:
\[
\frac{10}{12} + \frac{t}{60} = 1
\]
\[
\frac{5}{6} + \frac{t}{60} = 1
\]
\[
\frac{t}{60} = \frac{1}{6}
\]
\[
t = 10
\]

Jetzt berechnen wir die Gesamtzeit bei einer Geschwindigkeit von \( s + 0,5 = 12,5 \) km/h und einer Cafézeit von \( \frac{t}{2} = 5 \) Minuten:
\[
\text{Laufzeit} = \frac{10}{12,5} = 0,8 \text{ Stunden} = 48 \text{ Minuten}
\]
\[
\text{Gesamtzeit} = 48 + 5 = 53 \text{ Minuten}
\boxed{53}
\]

Gemini:

Um diese Aufgabe zu lösen, müssen wir zuerst die Werte für s und t herausfinden. Dazu können wir die gegebenen Informationen in Gleichungen umwandeln.

Schritt 1: Gleichungen aufstellen

Wir wissen, dass Jonna 10 km joggt. Die Zeit, die sie dafür benötigt, hängt von ihrer Geschwindigkeit ab. Wir können die Formel Zeit = Strecke / Geschwindigkeit verwenden.

  • Fall 1: Geschwindigkeit = s km/h, Zeit = 60 Minuten (1 Stunde), inklusive t Minuten Pause.
    • Gleichung: 10/s + t/60 = 1
  • Fall 2: Geschwindigkeit = (s-2) km/h, Zeit = 70 Minuten (7/6 Stunden), inklusive t Minuten Pause.
    • Gleichung: 10/(s-2) + t/60 = 7/6

Schritt 2: Gleichungen lösen

Wir haben jetzt zwei Gleichungen mit zwei Unbekannten (s und t). Wir können diese Gleichungen lösen, um die Werte für s und t zu finden.

  • Vereinfachen wir die Gleichungen:
    • 10/s + t/60 = 1 => 600 + st = 60s
    • 10/(s-2) + t/60 = 7/6 => 3600 + 6st = 420(s-2)
  • Lösen wir die erste Gleichung nach t auf: t = 60s – 600/s
  • Setzen wir diesen Wert für t in die zweite Gleichung ein und vereinfachen:
    • 3600 + 6s(60s – 600/s) = 420(s-2)
    • 3600 + 360s^2 – 3600 = 420s – 840
    • 360s^2 – 420s + 840 = 0
  • Diese quadratische Gleichung können wir lösen (z.B. mit der Mitternachtsformel). Die Lösungen sind s = 7 und s = 10/3. Da Jonna im zweiten Fall langsamer läuft (s-2), muss s größer als 2 sein. Daher ist s = 7 km/h die richtige Lösung.
  • Setzen wir s = 7 in die Gleichung für t ein: t = 60 * 7 – 600/7 = 334,3 Minuten (ungefähr)

Schritt 3: Neue Zeit berechnen

Jetzt kennen wir s = 7 km/h und t = 334,3 Minuten. Wir können die Zeit berechnen, die Jonna benötigt, wenn sie mit s + 0,5 = 7,5 km/h läuft und nur 1/2 * t Minuten Pause macht.

  • Neue Geschwindigkeit: 7,5 km/h
  • Neue Pausenzeit: 334,3 Minuten / 2 = 167,15 Minuten
  • Zeit zum Joggen: 10 km / 7,5 km/h = 4/3 Stunden = 80 Minuten
  • Gesamtzeit: 80 Minuten + 167,15 Minuten = 247,15 Minuten

Antwort:

Wenn Jonna mit 7,5 km/h läuft und nur einen Espresso trinkt, der halb so lange dauert wie ihr normaler Kaffee, benötigt sie ungefähr 247,15 Minuten.

disruptive KI Akademie: die neue Art der KI-Ausbildung

Eigene Mitarbeitenden in der Nutzung von GenAI auszubilden, ist der wichtigste Hebel, um die neuen Technologien produktiv zu nutzen. Nur: Klassische Schulungen sind zu wenig flexibel, um Menschen unterschiedlicher Wissensstände und Bedürfnisse effizient zu trainieren.

Unsere neue KI Akademie ermöglicht es Firmen, dass jede:r Mitarbeitende:n entlang individueller Lernpfade das trainiert, was er oder sie wirklich braucht. Die Software läuft auf jedem Device – man kann also seine KI-Sessions im Büro, im Mobile Office oder unterwegs bearbeiten. Gamification- und Video-Formate machen das Training interaktiv und kurzweilig.

Die disruptive KI Akademie spart viel Geld im Vergleich zu aufwändigen Präsenztrainings, ist DSGVO-konform und entspricht Konzern-Sicherheitsstandards. Erfahren Sie hier mehr.

Nach oben scrollen