DeepSeek: Der chinesische KI-Herausforderer, der die Branche aufmischt
über
Die KI-Branche wird durch das Auftauchen des Chinesischen KI-Uternehmens DeepSeek (dieser Link funktioniert möglicherweise nicht wenn Sie ihm folgen, da das Unternehmen gegen einen Cyberattack) aufgeschreckt, das ein leistungsstarkes Large Language Model (LLM) zu einem Bruchteil der Kosten westlicher Pendants entwickelt hat. Mit seiner neuesten Open-Source-Version unter der MIT-Lizenz, DeepSeek die KI-Landschaft auf, löst Marktreaktionen aus und heizt Spekulationen über die Zukunft des KI Wettbewerbs an.
DeepSeek: KI-Kraftpaket zum Schnäppchenpreis?
Das Flaggschiff von DeepSeek, das DeepSeek-R1-Modell, kostete Berichten zufolge nur 5,6 Millionen US-Dollar für das Training, ein Bruchteil der über 100 Millionen US-Dollar teuren budgets von KI-Gianten wie OpenAI, Google, und Anthropic. Trotzdem erreicht DeepSeek-R1 Benchmark-Ergebnisse, die mit ChatGPT vergleichbar sind, und Kostet geleichzeitig deutlich weniger.
Im Gegensatz zu vielen KI-Modellen, die auf Brute-Force-Berechnungen basieren, hat DeepSeek das Training optimiert, indem es sich auf Reinforcement Learning und Schritt-für-Schritt-Denken konzentriert und so die Genauigkeit ohne übermäßigen Rechenaufwand verbessert. Das Modell zerlegt komplexe Probleme in kleinere Schritte, vergleichbar mit der einfacheren schriftlichen langen Division.
Hardwareeffizienz und lokale Bereitstellung
Während die US-Exportbeschränkungen China daran gehindert haben, auf die Spitzen-KI-Chips von Nvidia (wie den H200 und die zukünftige B100) zuzugreifen, hat DeepSeek diese Beschränkungen umgangen. Anstatt sich auf Ultra-High-End-Hardware zu verlassen, trainierte das Unternehmen sein Modell mit 2.048 Nvidia H800-GPUs, die weniger leistungsstark sind als die beschränkten H100, aber dennoch effizient für KI-Workloads. Die H800 ist laut NVIDIA.
"eine modifizierte Version der H100, die aufgrund von Exportbestimmungen speziell auf dem chinesischen Markt verkauft wird".
Um sein disruptives Potenzial weiter zu erhöhen, hat DeepSeek reduzierte Versionen seines Modells veröffentlicht, die es ermöglichen, auf Consumer-Hardware zu laufen. Eine solche Version wurde kürzlich lokal auf einem Raspberry Pi mit einer SSD und einem Hailo-Modul demonstriert und erreichte 200 Token pro Sekunde. Sehen Sie, wie Jeff Geerling das geschafft hat:
Die H800 sind weniger leistungsfähig als die exportbeschränkten H100, aber immer noch in der Lage, groß angelegtes KI-Training durchzuführen. Die Notwendigkeit, diese KI-Chips der unteren Preisklasse zu verwenden, zwingt chinesische Forscher dazu, ihre Trainingsmethoden zu optimieren und sich mehr auf die Effizienz der Software als auf Brute-Force-Berechnungen zu verlassen. Trotzdem ist es DeepSeek gelungen, eine wettbewerbsfähige KI-Leistung zu erzielen, was beweist, dass strategisches Algorithmusdesign die Hardwarebeschränkungen ausgleichen kann.
Marktreaktion und Auswirkungen auf die Branche
Der rasante Aufstieg von DeepSeek hat bereits Wellen auf den globalen Märkten geschlagen. Nach seiner Einführung stürzte der Nasdaq Composite Index an einem Tag um fast 3 % ab, wobei Tech-Aktien – insbesondere die von KI-lastigen Unternehmen wie Nvidia, Microsoft und Alphabet — verluste erlitten. Die KI-Branche sieht sich nun mit der Realität eines qualitativ hochwertigen, kostengünstigen Open-Source-Wettbewerbs konfrontiert, der die Erlösmodelle proprietärer KI-Dienste in Frage stellen könnte.
Eine Verschiebung hin zu Edge-KI?
Einer der spannendsten Aspekte des Ansatzes von DeepSeek sind seine potenziellen Auswirkungen auf IoT und edge computing. Mit leichtgewichtigen KI-Modellen, die auf stromsparender Hardware ausgeführt werden können, ebnet DeepSeek den Weg für die lokale KI-Verarbeitung in Echtzeit in Bereichen wie Energiemanagement, Automatisierung und eingebettete Systeme. Dies könnte die Abhängigkeit von Cloud-basierten KI-Diensten verringern, die Betriebskosten senken und den Datenschutz verbessern, da die Datenverarbeitung auf dem Gerät verbleibt.
Die Zukunft des KI-Wettbewerbs
Da DeepSeek bewiesen hat, dass High-End-KI-Modelle zu einem Bruchteil der herkömmlichen Kosten trainiert werden können, sind die weiteren Auswirkungen klar:
- Open-Source-KI wird zunehmend wettbewerbsfähig.
- Effizienz und algorithmische Verbesserungen können wichtiger sein als die reine Rechenleistung.
- Chinas KI-Ökosystem entwickelt sich trotz Hardware-Einschränkungen rasant weiter.
Ob DeepSeek den Markt weiterhin aufmischt, bleibt abzuwarten, aber eines ist sicher: Das KI-Rennen ist gerade viel interessanter geworden.
Diskussion (1 Kommentar)