Künstliche Intelligenz 28.01.2025, 16:30 Uhr

So gelang China das KI-Wunder Deepseek trotz Chipembargo

Dem chinesischen KI-Start-up Deepseek scheint ein leistungsstarkes KI-Modell gelungen zu sein, das mit geringen Ressourcen auskommt.

China DeepSeek AI

Die USA dachten, sie könnten China beim Wettlauf um die künstliche Intelligenz mit Ausfuhrbeschränkungen für Hochleistungschips auf Abstand halten. Deepseek beweist: Die Strategie ist gescheitert.

Foto: picture alliance / ASSOCIATED PRESS/Andy Wong

Künstliche Intelligenz (KI) hat in den letzten Jahren riesige Fortschritte gemacht. Eine der jüngsten Sensationen ist die leistungsfähige KI-Plattform Deepseek V3 und R1 aus China. Was diese Entwicklung des gleichnamigen Start-ups besonders bemerkenswert macht, ist Chinas Fähigkeit, trotz eines Embargos bezüglich der Halbleiter in Schlüsseltechnologien durch westliche Staaten eine so beeindruckende KI zu entwickeln. In offenbar überschaubarer Entwicklungszeit und mit ebenfalls überschaubaren Ressourcen ist eine kompetitive KI entstanden, die zudem noch auf einem freien Lizenzmodell zugänglich ist.

Deepseek verarbeitet Informationen aus Text, Bild, Video und Audio gleichzeitig

Deepseek basiert auf einem fortschrittlichen Transformer-Modell – ähnlich wie GPT (Generative Pretrained Transformer), jedoch mit spezifischen Optimierungen, die es in seiner Architektur neuartig machen. Auffällig ist der Multi-Dimensional-Attention-Mechanismus, der es ermöglicht, nicht nur sequenzielle, sondern auch multi-modale Daten in Echtzeit zu verarbeiten. Das bedeutet, dass das Modell Informationen aus Text, Bild, Video und Audio gleichzeitig verarbeiten kann, ohne separate Module zu benötigen.

Ein weiteres Merkmal ist das adaptive Quantisierungsverfahren. Diese Methode optimiert die Präzision der numerischen Repräsentation und reduziert dadurch den Bedarf an hochleistungsfähigen Chips erheblich. Ebenfalls als ressourcenschonend ist der Einsatz von Federated Learning. Diese Technik erlaubt es, das Training eines Modells auf eine Vielzahl verteilter Systeme aufzuteilen. Dadurch kann Deepseek effizient trainiert und genutzt werden, ohne dass eine zentrale Hochleistungsinfrastruktur erforderlich ist.

Top Stellenangebote

Zur Jobbörse
Immobilien Management Essen GmbH (IME)-Firmenlogo
(Senior) Projektkoordinator (m/w/d) Hochbau & Stadtentwicklung Immobilien Management Essen GmbH (IME)
Allbau Managementgesellschaft mbH-Firmenlogo
Projektentwickler (m/w/d) Immobilien Allbau Managementgesellschaft mbH
RINGSPANN GmbH-Firmenlogo
Vertriebsingenieur (m/w/d) als Produkt-Account-Manager Antriebskomponenten/Bremsen RINGSPANN GmbH
Bad Homburg Zum Job 
Crawford & Company (Deutschland) GmbH-Firmenlogo
Technical Expert / Sachverständiger (w/m/d) Bereich Global Technical Services Crawford & Company (Deutschland) GmbH
verschiedene Einsatzorte Zum Job 
GVE Grundstücksverwaltung Stadt Essen GmbH-Firmenlogo
Projektleiter (m/w/d) Schulbau GVE Grundstücksverwaltung Stadt Essen GmbH
KLEBL GmbH-Firmenlogo
Projektleiter (m/w/d) für Hoch- und Schlüsselfertigbau KLEBL GmbH
Raum Berlin-Brandenburg Zum Job 
KLEBL GmbH-Firmenlogo
Projektleiter (m/w/d) für Hoch- und Schlüsselfertigbau KLEBL GmbH
Frankfurt Zum Job 
KLEBL GmbH-Firmenlogo
Kalkulator (m/w/d) im Bereich Hochbau- und Schlüsselfertigbau KLEBL GmbH
Berlin-Brandenburg Zum Job 
KLEBL GmbH-Firmenlogo
Bauleiter (m/w/d) im Hausbau KLEBL GmbH
Neumarkt Zum Job 
Oncotec Pharma Produktion GmbH-Firmenlogo
Head of Project Engineering (m/w/d) Oncotec Pharma Produktion GmbH
Dessau-Roßlau Zum Job 
Oncotec Pharma Produktion GmbH-Firmenlogo
Projektingenieur (Investitionsprojekte) (m/w/d) Oncotec Pharma Produktion GmbH
Dessau-Roßlau Zum Job 
Oncotec Pharma Produktion GmbH-Firmenlogo
HSE-Manager (m/w/d) Oncotec Pharma Produktion GmbH
Dessau-Roßlau Zum Job 
DYNOS GmbH-Firmenlogo
Leiter Technik (m/w/d) DYNOS GmbH
Troisdorf Zum Job 
Stadt Ratingen-Firmenlogo
Planung / Bauleitung Siedlungswasserwirtschaft (m/w/d) Stadt Ratingen
Ratingen Zum Job 
KLN Ultraschall AG-Firmenlogo
Strategischer Einkäufer im Sondermaschinenbau (m/w/d) KLN Ultraschall AG
Heppenheim (Bergstraße) Zum Job 
Max Bögl Transport und Geräte GmbH & Co. KG-Firmenlogo
Prozesskoordinator (m/w/d) - Produktionstechnik Max Bögl Transport und Geräte GmbH & Co. KG
Sengenthal Zum Job 
Hochschule Emden/Leer-Firmenlogo
Professur (m/w/d) für Elektrische Energietechnik Hochschule Emden/Leer
Beckhoff Automation GmbH & Co. KG-Firmenlogo
Technischer Redakteur (m/w/d) für Maschinenbau Beckhoff Automation GmbH & Co. KG
Herzebrock-Clarholz Zum Job 
Hamburger Hochbahn AG-Firmenlogo
Bauingenieur / Projektingenieur Ingenieurbau (w/m/d) Hamburger Hochbahn AG
Hamburg Zum Job 
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 

KI-Hardware-Not macht erfinderisch: Nvidias GPUs unterliegen Embargo

Statt auf westliche Hochleistungs-GPUs wie die Nvidia A100 oder H100 zurückzugreifen, setzt China auf neue, eigens entwickelte Asics (Application-specific integrated circuits) und Risc-V-basierte Prozessoren, die speziell für KI-Operationen optimiert sind. Zwar erreichen diese Chips nicht die Leistung westlicher High-End-Produkte. Da sie durch Softwareoptimierungen effizient genutzt werden, bleibt die Gesamtleistung dennoch konkurrenzfähig. Ein zentraler Punkt scheint die Eigenentwicklung von Hardware zu sein. Mit massiven Investitionen in die Halbleiterindustrie wurden Chips geschaffen, die speziell auf KI-Anwendungen zugeschnitten sind. Besonders die Prozessorarchitektur Risc-V ermöglicht es chinesischen Unternehmen, flexible und kostengünstige Chips zu entwickeln. Neben der Hardwareoptimierung setzt China auf Softwareoptimierungen. Es wurden Algorithmen geschaffen, die ressourceneffizienter arbeiten als westliche Pendants. Verfahren wie Sparse Training und fortschrittliche Komprimierungsmethoden reduzieren den Rechenaufwand und damit die Abhängigkeit von Hochleistungshardware.

Kontrollmechanismen wurden vermutlich ebenfalls umgangen

Ein weiterer Ansatz, um die Folgen des Embargos abzumildern, ist der Einsatz von Clustersystemen mit Chips in mittleren Leistungsklassen. Statt eine zentralisierte Infrastruktur mit High-End-GPUs zu betreiben, hat China Netzwerke aus weniger performanten Prozessoren geschaffen, die in verteilten Systemen parallel arbeiten. Diese Cluster-Computing-Strategie wird durch spezialisierte Frameworks wie Mindspore oder Paddlepaddle optimal genutzt. Vermutet wird auch, dass China auf internationale Kooperationen und Umgehungsstrategien der Embargos setzt. Trotz strenger Kontrollen gelingt es chinesischen Unternehmen, moderne Technologien indirekt zu beschaffen. Dies geschieht durch Partnerschaften mit Ländern, die nicht am Embargo beteiligt sind, oder durch das Reverse Engineering importierter Produkte. Die Entwicklung von Deepseek V3 innerhalb einer relativ kurzen Zeitspanne deutet darauf hin, dass die Grundlagen früherer KI-Plattform zügig weiterentwickelt wurden. China hat vermutlich frühzeitig mit der Forschung an alternativen Hardware- und Softwarestrategien begonnen, um sich von westlicher Technologie unabhängiger zu machen.

Chinas Fähigkeit, trotz erheblicher Handelsbeschränkungen eine konkurrenzfähige KI zu entwickeln, zeigt, dass Einschränkungen oft als Ansporn für Innovationen dienen können. Die globalen Auswirkungen dieser Entwicklung sind noch nicht vollständig absehbar, doch es ist offensichtlich, dass der internationale Wettbewerb im KI-Sektor durch Deepseek erheblich an Dynamik gewonnen hat. Szeneexperten wie Anjney Midha, Mitbegründer und CEO der Augmented-Reality-Plattform Ubiquity6, äußerte sich bei X sogar überschwänglich: „Praktisch über Nacht hat sich Deepseek R1 zum Modell der Wahl für Amerikas Top-Universitäten von Stanford bis hin zum MIT entwickelt.“

Bei aller aktuellen Euphorie darf aber nicht vergessen werden, dass bei der Nutzung des chinesischen Sprachmodells Daten unkontrolliert auf chinesische Server fließen. Gerade bei vertraulichen und personenbezogenen Informationen ist das ein nicht zu vernachlässigender Faktor, den vor allem Unternehmen bedenken sollten.

Ein Beitrag von:

  • Elke von Rekowski

    Chefredakteurin der VDI energie + umwelt und freie Redakteurin der VDI nachrichten sowie Ingenieur.de, unter anderem für die Themen Elektronik und Telekommunikation. Als langjährige Technikjournalistin arbeitete sie für verschiedene Branchenmagazine und Fachzeitschriften. Außerdem ist sie Mit-Gründerin einer E-Health Nachrichtenplattform.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.