Künstliche Intelligenz 28.01.2025, 16:30 Uhr

So gelang China das KI-Wunder Deepseek trotz Chipembargo

Dem chinesischen KI-Start-up Deepseek scheint ein leistungsstarkes KI-Modell gelungen zu sein, das mit geringen Ressourcen auskommt.

China DeepSeek AI

Die USA dachten, sie könnten China beim Wettlauf um die künstliche Intelligenz mit Ausfuhrbeschränkungen für Hochleistungschips auf Abstand halten. Deepseek beweist: Die Strategie ist gescheitert.

Foto: picture alliance / ASSOCIATED PRESS/Andy Wong

Künstliche Intelligenz (KI) hat in den letzten Jahren riesige Fortschritte gemacht. Eine der jüngsten Sensationen ist die leistungsfähige KI-Plattform Deepseek V3 und R1 aus China. Was diese Entwicklung des gleichnamigen Start-ups besonders bemerkenswert macht, ist Chinas Fähigkeit, trotz eines Embargos bezüglich der Halbleiter in Schlüsseltechnologien durch westliche Staaten eine so beeindruckende KI zu entwickeln. In offenbar überschaubarer Entwicklungszeit und mit ebenfalls überschaubaren Ressourcen ist eine kompetitive KI entstanden, die zudem noch auf einem freien Lizenzmodell zugänglich ist.

Deepseek verarbeitet Informationen aus Text, Bild, Video und Audio gleichzeitig

Deepseek basiert auf einem fortschrittlichen Transformer-Modell – ähnlich wie GPT (Generative Pretrained Transformer), jedoch mit spezifischen Optimierungen, die es in seiner Architektur neuartig machen. Auffällig ist der Multi-Dimensional-Attention-Mechanismus, der es ermöglicht, nicht nur sequenzielle, sondern auch multi-modale Daten in Echtzeit zu verarbeiten. Das bedeutet, dass das Modell Informationen aus Text, Bild, Video und Audio gleichzeitig verarbeiten kann, ohne separate Module zu benötigen.

Ein weiteres Merkmal ist das adaptive Quantisierungsverfahren. Diese Methode optimiert die Präzision der numerischen Repräsentation und reduziert dadurch den Bedarf an hochleistungsfähigen Chips erheblich. Ebenfalls als ressourcenschonend ist der Einsatz von Federated Learning. Diese Technik erlaubt es, das Training eines Modells auf eine Vielzahl verteilter Systeme aufzuteilen. Dadurch kann Deepseek effizient trainiert und genutzt werden, ohne dass eine zentrale Hochleistungsinfrastruktur erforderlich ist.

Stellenangebote im Bereich IT/TK-Projektmanagement

IT/TK-Projektmanagement Jobs
THD - Technische Hochschule Deggendorf-Firmenlogo
Professorin / Professor (m/w/d) für das Lehrgebiet "Informatik" THD - Technische Hochschule Deggendorf
Deggendorf Zum Job 
Hochschule Heilbronn-Firmenlogo
Professur für künstliche Intelligenz in industriellen Systemen Hochschule Heilbronn
Künzelsau, Heilbronn, Schwäbisch Hall Zum Job 
ESFORIN SE-Firmenlogo
Mitarbeiter*in Marktkommunikation & Prozesse (m/w/d) ESFORIN SE
DFS Deutsche Flugsicherung GmbH-Firmenlogo
Referent (m/w/d) Anforderungsmanagement Funktionale Systeme DFS Deutsche Flugsicherung GmbH
DNV GL SE-Firmenlogo
(Senior) Consultant for Digital System Operation (m/w/d) DNV GL SE
Dresden, Schönefeld Zum Job 
Jauss HR-Consulting GmbH & Co. KG-Firmenlogo
Automatisierungstechniker / Ingenieur / Techniker (m/w/d) TIA-Programmierung & Inbetriebnahme - Baustoffanlagenbau Jauss HR-Consulting GmbH & Co. KG
Raum Würzburg Zum Job 
Helmholtz-Zentrum Hereon-Firmenlogo
Systementwicklungsingenieurin (m/w/d) für Mess- und Steuerungssystemen Helmholtz-Zentrum Hereon
Geesthacht (bei Hamburg) Zum Job 
Motherson Group-Firmenlogo
Hardware Architect - Automotive (m/f/d) Motherson Group
Stuttgart Zum Job 
IMS Messsysteme GmbH-Firmenlogo
Entwicklungsingenieur (m/w/i) Systemsoftware IMS Messsysteme GmbH
Heiligenhaus Zum Job 
Drägerwerk AG & Co. KGaA-Firmenlogo
Ingenieur / Specialist (m/w/d) Software und Datenkommunikation Drägerwerk AG & Co. KGaA
Lübeck Zum Job 
FCP Ingenieure Deutschland GmbH-Firmenlogo
BIM-Modeller (m/w/d) FCP Ingenieure Deutschland GmbH
Deutsches Elektronen-Synchrotron DESY-Firmenlogo
Bauingenieurin als Bauinformatikerin (m/w/d) für die Einführung von Revit Deutsches Elektronen-Synchrotron DESY
Hamburg Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Geoinformatiker (w/m/d) Die Autobahn GmbH des Bundes
Hannover Zum Job 
Bundesamt für Bauwesen und Raumordnung (BBR)-Firmenlogo
Referentin / Referent (w/m/d) in der Kompetenzstelle BIM Bundesamt für Bauwesen und Raumordnung (BBR)
Bonn, Berlin Zum Job 
Die Autobahn GmbH des Bundes-Firmenlogo
Senior (w/m/d) BIM Consultant Die Autobahn GmbH des Bundes
Mehrer Compression GmbH-Firmenlogo
Ingenieur für Elektrotechnik (m/w/d) Mehrer Compression GmbH
Balingen Zum Job 
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
Hochschule Angewandte Wissenschaften München-Firmenlogo
Professur für Data und Knowledge Engineering (W2) Hochschule Angewandte Wissenschaften München
München Zum Job 
THD - Technische Hochschule Deggendorf-Firmenlogo
Professorin / Professor (m/w/d) für das Lehrgebiet "Informatik" THD - Technische Hochschule Deggendorf
Deggendorf Zum Job 
THD - Technische Hochschule Deggendorf-Firmenlogo
Professorin / Professor (m/w/d) für das Lehrgebiet "Informatik" THD - Technische Hochschule Deggendorf
Deggendorf Zum Job 
Hochschule Heilbronn-Firmenlogo
Professur für künstliche Intelligenz in industriellen Systemen Hochschule Heilbronn
Künzelsau, Heilbronn, Schwäbisch Hall Zum Job 
ESFORIN SE-Firmenlogo
Mitarbeiter*in Marktkommunikation & Prozesse (m/w/d) ESFORIN SE
DFS Deutsche Flugsicherung GmbH-Firmenlogo
Referent (m/w/d) Anforderungsmanagement Funktionale Systeme DFS Deutsche Flugsicherung GmbH

KI-Hardware-Not macht erfinderisch: Nvidias GPUs unterliegen Embargo

Statt auf westliche Hochleistungs-GPUs wie die Nvidia A100 oder H100 zurückzugreifen, setzt China auf neue, eigens entwickelte Asics (Application-specific integrated circuits) und Risc-V-basierte Prozessoren, die speziell für KI-Operationen optimiert sind. Zwar erreichen diese Chips nicht die Leistung westlicher High-End-Produkte. Da sie durch Softwareoptimierungen effizient genutzt werden, bleibt die Gesamtleistung dennoch konkurrenzfähig. Ein zentraler Punkt scheint die Eigenentwicklung von Hardware zu sein. Mit massiven Investitionen in die Halbleiterindustrie wurden Chips geschaffen, die speziell auf KI-Anwendungen zugeschnitten sind. Besonders die Prozessorarchitektur Risc-V ermöglicht es chinesischen Unternehmen, flexible und kostengünstige Chips zu entwickeln. Neben der Hardwareoptimierung setzt China auf Softwareoptimierungen. Es wurden Algorithmen geschaffen, die ressourceneffizienter arbeiten als westliche Pendants. Verfahren wie Sparse Training und fortschrittliche Komprimierungsmethoden reduzieren den Rechenaufwand und damit die Abhängigkeit von Hochleistungshardware.

Kontrollmechanismen wurden vermutlich ebenfalls umgangen

Ein weiterer Ansatz, um die Folgen des Embargos abzumildern, ist der Einsatz von Clustersystemen mit Chips in mittleren Leistungsklassen. Statt eine zentralisierte Infrastruktur mit High-End-GPUs zu betreiben, hat China Netzwerke aus weniger performanten Prozessoren geschaffen, die in verteilten Systemen parallel arbeiten. Diese Cluster-Computing-Strategie wird durch spezialisierte Frameworks wie Mindspore oder Paddlepaddle optimal genutzt. Vermutet wird auch, dass China auf internationale Kooperationen und Umgehungsstrategien der Embargos setzt. Trotz strenger Kontrollen gelingt es chinesischen Unternehmen, moderne Technologien indirekt zu beschaffen. Dies geschieht durch Partnerschaften mit Ländern, die nicht am Embargo beteiligt sind, oder durch das Reverse Engineering importierter Produkte. Die Entwicklung von Deepseek V3 innerhalb einer relativ kurzen Zeitspanne deutet darauf hin, dass die Grundlagen früherer KI-Plattform zügig weiterentwickelt wurden. China hat vermutlich frühzeitig mit der Forschung an alternativen Hardware- und Softwarestrategien begonnen, um sich von westlicher Technologie unabhängiger zu machen.

Chinas Fähigkeit, trotz erheblicher Handelsbeschränkungen eine konkurrenzfähige KI zu entwickeln, zeigt, dass Einschränkungen oft als Ansporn für Innovationen dienen können. Die globalen Auswirkungen dieser Entwicklung sind noch nicht vollständig absehbar, doch es ist offensichtlich, dass der internationale Wettbewerb im KI-Sektor durch Deepseek erheblich an Dynamik gewonnen hat. Szeneexperten wie Anjney Midha, Mitbegründer und CEO der Augmented-Reality-Plattform Ubiquity6, äußerte sich bei X sogar überschwänglich: „Praktisch über Nacht hat sich Deepseek R1 zum Modell der Wahl für Amerikas Top-Universitäten von Stanford bis hin zum MIT entwickelt.“

Bei aller aktuellen Euphorie darf aber nicht vergessen werden, dass bei der Nutzung des chinesischen Sprachmodells Daten unkontrolliert auf chinesische Server fließen. Gerade bei vertraulichen und personenbezogenen Informationen ist das ein nicht zu vernachlässigender Faktor, den vor allem Unternehmen bedenken sollten.

Ein Beitrag von:

  • Elke von Rekowski

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.