Künstliche Intelligenz 28.01.2025, 16:30 Uhr

So gelang China das KI-Wunder Deepseek trotz Chipembargo

Dem chinesischen KI-Start-up Deepseek scheint ein leistungsstarkes KI-Modell gelungen zu sein, das mit geringen Ressourcen auskommt.

China DeepSeek AI

Die USA dachten, sie könnten China beim Wettlauf um die künstliche Intelligenz mit Ausfuhrbeschränkungen für Hochleistungschips auf Abstand halten. Deepseek beweist: Die Strategie ist gescheitert.

Foto: picture alliance / ASSOCIATED PRESS/Andy Wong

Künstliche Intelligenz (KI) hat in den letzten Jahren riesige Fortschritte gemacht. Eine der jüngsten Sensationen ist die leistungsfähige KI-Plattform Deepseek V3 und R1 aus China. Was diese Entwicklung des gleichnamigen Start-ups besonders bemerkenswert macht, ist Chinas Fähigkeit, trotz eines Embargos bezüglich der Halbleiter in Schlüsseltechnologien durch westliche Staaten eine so beeindruckende KI zu entwickeln. In offenbar überschaubarer Entwicklungszeit und mit ebenfalls überschaubaren Ressourcen ist eine kompetitive KI entstanden, die zudem noch auf einem freien Lizenzmodell zugänglich ist.

Deepseek verarbeitet Informationen aus Text, Bild, Video und Audio gleichzeitig

Deepseek basiert auf einem fortschrittlichen Transformer-Modell – ähnlich wie GPT (Generative Pretrained Transformer), jedoch mit spezifischen Optimierungen, die es in seiner Architektur neuartig machen. Auffällig ist der Multi-Dimensional-Attention-Mechanismus, der es ermöglicht, nicht nur sequenzielle, sondern auch multi-modale Daten in Echtzeit zu verarbeiten. Das bedeutet, dass das Modell Informationen aus Text, Bild, Video und Audio gleichzeitig verarbeiten kann, ohne separate Module zu benötigen.

Ein weiteres Merkmal ist das adaptive Quantisierungsverfahren. Diese Methode optimiert die Präzision der numerischen Repräsentation und reduziert dadurch den Bedarf an hochleistungsfähigen Chips erheblich. Ebenfalls als ressourcenschonend ist der Einsatz von Federated Learning. Diese Technik erlaubt es, das Training eines Modells auf eine Vielzahl verteilter Systeme aufzuteilen. Dadurch kann Deepseek effizient trainiert und genutzt werden, ohne dass eine zentrale Hochleistungsinfrastruktur erforderlich ist.

Stellenangebote im Bereich IT/TK-Projektmanagement

IT/TK-Projektmanagement Jobs
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur (w/m/d) Informationssicherheit Die Autobahn GmbH des Bundes
Frankfurt Zum Job 
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
Evonik Operations GmbH-Firmenlogo
Ingenieur (m/w/d) Informatik / Elektrotechnik / Automatisierungstechnik / Chemische Produktion Evonik Operations GmbH
WIRTGEN GROUP Branch of John Deere GmbH & Co. KG-Firmenlogo
Project Manager Surveying and Designfor Machine Control (m/w/d) WIRTGEN GROUP Branch of John Deere GmbH & Co. KG
Ludwigshafen am Rhein Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Systemingenieur (m/w/i) für Oberflächeninspektion IMS Messsysteme GmbH
Heiligenhaus Zum Job 
Bundespolizei-Firmenlogo
Ingenieur/in Elektro-/Nachrichtentechnik o. ä. für Satellitenkommunikation (w/m/d) Projektgruppe EU Bundespolizei
Sankt Augustin Zum Job 
Hochschule Hamm-Lippstadt-Firmenlogo
wissenschaftliche*r Mitarbeiter*in (m/w/d) für die Entwicklung einer Wissensdatenbank im Bereich der Sektorenkopplung Hochschule Hamm-Lippstadt
Hochschule Bielefeld-Firmenlogo
W2-Professur Software Engineering Hochschule Bielefeld
Gütersloh Zum Job 
Safran Data Systems GmbH-Firmenlogo
Embedded Software Engineer (m/w/d) Safran Data Systems GmbH
Bergisch Gladbach Zum Job 
Hochschule Bielefeld (HSBI)-Firmenlogo
W2-Professur Software Engineering Hochschule Bielefeld (HSBI)
Gütersloh Zum Job 
Kreis Gütersloh-Firmenlogo
Mitarbeiter (m/w/i) für Digitalisierung und Prozessmanagement Kreis Gütersloh
Rheda-Wiedenbrück Zum Job 
Bisping & Bisping GmbH & Co. KG-Firmenlogo
Projektleiter (m/w/d) Internetkommunikation / Telekommunikation Bisping & Bisping GmbH & Co. KG
Lauf an der Pegnitz Zum Job 
Bisping & Bisping GmbH & Co. KG-Firmenlogo
Projektleiter (m/w/d) Glasfaserausbau Bisping & Bisping GmbH & Co. KG
Lauf an der Pegnitz Zum Job 
Stadt Frankfurt am Main-Firmenlogo
Ingenieur:innen (w/m/d) Verkehrstechnik Stadt Frankfurt am Main
Frankfurt am Main Zum Job 
Leibniz Institut für Naturstoff-Forschung und Infektionsbiologie e.V. Hans-Knöll-Institut (HKI)-Firmenlogo
Software Engineer (m/f/div) Leibniz Institut für Naturstoff-Forschung und Infektionsbiologie e.V. Hans-Knöll-Institut (HKI)
Leibniz Institut für Naturstoff-Forschung und Infektionsbiologie e.V. Hans-Knöll-Institut (HKI)-Firmenlogo
Software Engineer (m/f/div) Leibniz Institut für Naturstoff-Forschung und Infektionsbiologie e.V. Hans-Knöll-Institut (HKI)
Prognost Systems GmbH-Firmenlogo
Technischer Kundenbetreuer / Elektroingenieur (m/w/d) im Customer Support Prognost Systems GmbH
Die Autobahn GmbH des Bundes-Firmenlogo
Ingenieur (w/m/d) C-ITS Entwicklung Die Autobahn GmbH des Bundes
Frankfurt am Main Zum Job 
Bundesanstalt für Arbeitsschutz und Arbeitsmedizin (BAuA)-Firmenlogo
Doktorandin / Doktorand (w/m/d) im Themenfeld: Künstliche Intelligenz Bundesanstalt für Arbeitsschutz und Arbeitsmedizin (BAuA)
Dortmund Zum Job 
Hamburger Stadtentwässerung AöR ein Unternehmen von HAMBURG WASSER-Firmenlogo
Ingenieur (m/w/d) Elektrotechnik als Projektleiter Hamburger Stadtentwässerung AöR ein Unternehmen von HAMBURG WASSER
Hamburg Zum Job 

KI-Hardware-Not macht erfinderisch: Nvidias GPUs unterliegen Embargo

Statt auf westliche Hochleistungs-GPUs wie die Nvidia A100 oder H100 zurückzugreifen, setzt China auf neue, eigens entwickelte Asics (Application-specific integrated circuits) und Risc-V-basierte Prozessoren, die speziell für KI-Operationen optimiert sind. Zwar erreichen diese Chips nicht die Leistung westlicher High-End-Produkte. Da sie durch Softwareoptimierungen effizient genutzt werden, bleibt die Gesamtleistung dennoch konkurrenzfähig. Ein zentraler Punkt scheint die Eigenentwicklung von Hardware zu sein. Mit massiven Investitionen in die Halbleiterindustrie wurden Chips geschaffen, die speziell auf KI-Anwendungen zugeschnitten sind. Besonders die Prozessorarchitektur Risc-V ermöglicht es chinesischen Unternehmen, flexible und kostengünstige Chips zu entwickeln. Neben der Hardwareoptimierung setzt China auf Softwareoptimierungen. Es wurden Algorithmen geschaffen, die ressourceneffizienter arbeiten als westliche Pendants. Verfahren wie Sparse Training und fortschrittliche Komprimierungsmethoden reduzieren den Rechenaufwand und damit die Abhängigkeit von Hochleistungshardware.

Kontrollmechanismen wurden vermutlich ebenfalls umgangen

Ein weiterer Ansatz, um die Folgen des Embargos abzumildern, ist der Einsatz von Clustersystemen mit Chips in mittleren Leistungsklassen. Statt eine zentralisierte Infrastruktur mit High-End-GPUs zu betreiben, hat China Netzwerke aus weniger performanten Prozessoren geschaffen, die in verteilten Systemen parallel arbeiten. Diese Cluster-Computing-Strategie wird durch spezialisierte Frameworks wie Mindspore oder Paddlepaddle optimal genutzt. Vermutet wird auch, dass China auf internationale Kooperationen und Umgehungsstrategien der Embargos setzt. Trotz strenger Kontrollen gelingt es chinesischen Unternehmen, moderne Technologien indirekt zu beschaffen. Dies geschieht durch Partnerschaften mit Ländern, die nicht am Embargo beteiligt sind, oder durch das Reverse Engineering importierter Produkte. Die Entwicklung von Deepseek V3 innerhalb einer relativ kurzen Zeitspanne deutet darauf hin, dass die Grundlagen früherer KI-Plattform zügig weiterentwickelt wurden. China hat vermutlich frühzeitig mit der Forschung an alternativen Hardware- und Softwarestrategien begonnen, um sich von westlicher Technologie unabhängiger zu machen.

Chinas Fähigkeit, trotz erheblicher Handelsbeschränkungen eine konkurrenzfähige KI zu entwickeln, zeigt, dass Einschränkungen oft als Ansporn für Innovationen dienen können. Die globalen Auswirkungen dieser Entwicklung sind noch nicht vollständig absehbar, doch es ist offensichtlich, dass der internationale Wettbewerb im KI-Sektor durch Deepseek erheblich an Dynamik gewonnen hat. Szeneexperten wie Anjney Midha, Mitbegründer und CEO der Augmented-Reality-Plattform Ubiquity6, äußerte sich bei X sogar überschwänglich: „Praktisch über Nacht hat sich Deepseek R1 zum Modell der Wahl für Amerikas Top-Universitäten von Stanford bis hin zum MIT entwickelt.“

Bei aller aktuellen Euphorie darf aber nicht vergessen werden, dass bei der Nutzung des chinesischen Sprachmodells Daten unkontrolliert auf chinesische Server fließen. Gerade bei vertraulichen und personenbezogenen Informationen ist das ein nicht zu vernachlässigender Faktor, den vor allem Unternehmen bedenken sollten.

Ein Beitrag von:

  • Elke von Rekowski

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.