Künstliche Intelligenz 28.01.2025, 16:30 Uhr

So gelang China das KI-Wunder Deepseek trotz Chipembargo

Dem chinesischen KI-Start-up Deepseek scheint ein leistungsstarkes KI-Modell gelungen zu sein, das mit geringen Ressourcen auskommt.

China DeepSeek AI

Die USA dachten, sie könnten China beim Wettlauf um die künstliche Intelligenz mit Ausfuhrbeschränkungen für Hochleistungschips auf Abstand halten. Deepseek beweist: Die Strategie ist gescheitert.

Foto: picture alliance / ASSOCIATED PRESS/Andy Wong

Künstliche Intelligenz (KI) hat in den letzten Jahren riesige Fortschritte gemacht. Eine der jüngsten Sensationen ist die leistungsfähige KI-Plattform Deepseek V3 und R1 aus China. Was diese Entwicklung des gleichnamigen Start-ups besonders bemerkenswert macht, ist Chinas Fähigkeit, trotz eines Embargos bezüglich der Halbleiter in Schlüsseltechnologien durch westliche Staaten eine so beeindruckende KI zu entwickeln. In offenbar überschaubarer Entwicklungszeit und mit ebenfalls überschaubaren Ressourcen ist eine kompetitive KI entstanden, die zudem noch auf einem freien Lizenzmodell zugänglich ist.

Deepseek verarbeitet Informationen aus Text, Bild, Video und Audio gleichzeitig

Deepseek basiert auf einem fortschrittlichen Transformer-Modell – ähnlich wie GPT (Generative Pretrained Transformer), jedoch mit spezifischen Optimierungen, die es in seiner Architektur neuartig machen. Auffällig ist der Multi-Dimensional-Attention-Mechanismus, der es ermöglicht, nicht nur sequenzielle, sondern auch multi-modale Daten in Echtzeit zu verarbeiten. Das bedeutet, dass das Modell Informationen aus Text, Bild, Video und Audio gleichzeitig verarbeiten kann, ohne separate Module zu benötigen.

Ein weiteres Merkmal ist das adaptive Quantisierungsverfahren. Diese Methode optimiert die Präzision der numerischen Repräsentation und reduziert dadurch den Bedarf an hochleistungsfähigen Chips erheblich. Ebenfalls als ressourcenschonend ist der Einsatz von Federated Learning. Diese Technik erlaubt es, das Training eines Modells auf eine Vielzahl verteilter Systeme aufzuteilen. Dadurch kann Deepseek effizient trainiert und genutzt werden, ohne dass eine zentrale Hochleistungsinfrastruktur erforderlich ist.

Top Stellenangebote

Zur Jobbörse
RHEINMETALL AG-Firmenlogo
Verstärkung für unsere technischen Projekte im Bereich Engineering und IT (m/w/d) RHEINMETALL AG
deutschlandweit Zum Job 
Forschungszentrum Jülich GmbH-Firmenlogo
PhD Position - Techno-economic assessment of geothermal plants with material co-production in energy systems Forschungszentrum Jülich GmbH
Jülich Zum Job 
Landesbetrieb Straßenbau und Verkehr Schleswig-Holstein-Firmenlogo
Bauingenieurin / Bauingenieur (w/m/d) für den Bereich Straßenbau Landesbetrieb Straßenbau und Verkehr Schleswig-Holstein
Kiel, Flensburg, Rendsburg, Itzehoe, Lübeck Zum Job 
Siegfried PharmaChemikalien Minden GmbH-Firmenlogo
Betriebsingenieur Mehrprodukte-Betrieb (w/m/d) Siegfried PharmaChemikalien Minden GmbH
Landeshauptstadt Wiesbaden-Firmenlogo
Teamleiter/-in Baugenehmigungsverfahren und Bauüberwachung (w/m/d) Landeshauptstadt Wiesbaden
Wiesbaden Zum Job 
Staatliches Bauamt Nürnberg-Firmenlogo
Projektleiter (m/w/d) / Projektbearbeiter (m/w/d) in der Fachrichtung Elektrotechnik Staatliches Bauamt Nürnberg
Nürnberg Zum Job 
ifp | Executive Search. Management Diagnostik.-Firmenlogo
Geschäftsführung (m/w/d) ifp | Executive Search. Management Diagnostik.
Ruhrgebiet Zum Job 
TenneT TSO-Firmenlogo
Betriebsingenieur Offshore (m/w/d) TenneT TSO
Hannover Zum Job 
Hochschule für Musik und Darstellende Kunst Frankfurt am Main-Firmenlogo
Ingenieur*in Energie, Klimaschutz und Transformation (w/m/d) Hochschule für Musik und Darstellende Kunst Frankfurt am Main
Frankfurt Zum Job 
Oberfinanzdirektion Baden-Württemberg Bundesbau-Firmenlogo
Elektrotechnikingenieur (w/m/d) Oberfinanzdirektion Baden-Württemberg Bundesbau
Freiburg Zum Job 
Birkenstock Productions Hessen GmbH-Firmenlogo
Ingenieur / Meister / Techniker Elektrotechnik / Automatisierungstechnik (m/w/d) Birkenstock Productions Hessen GmbH
Steinau an der Straße Zum Job 
Staatliches Baumanagement Region Nord-West-Firmenlogo
Architekten, Bau- und Elektroingenieure (m/w/d) Staatliches Baumanagement Region Nord-West
Wilhelmshaven Zum Job 
Staatliches Baumanagement Region Nord-West-Firmenlogo
Architekten / Bauingenieure (m/w/d) Hochbau Staatliches Baumanagement Region Nord-West
verschiedene Standorte Zum Job 
Staatliches Baumanagement Region Nord-West-Firmenlogo
Ingenieure (m/w/d) Versorgungstechnik bzw. Technische Gebäudeausrüstung Staatliches Baumanagement Region Nord-West
Wilhelmshaven, Bad Iburg, Oldenburg, Aurich, Meppen, Emden Zum Job 
Staatliches Baumanagement Region Nord-West-Firmenlogo
Ingenieure (m/w/d) der Fachrichtungen konstruktiver Ingenieurbau/Tiefbau/Geo-/Naturwissenschaften/Landschaftsbau Staatliches Baumanagement Region Nord-West
verschiedene Standorte Zum Job 
Staatliches Baumanagement Region Nord-West-Firmenlogo
Ingenieure (m/w/d) Elektrotechnik Staatliches Baumanagement Region Nord-West
verschiedene Standorte Zum Job 
WITTENSTEIN SE-Firmenlogo
Werkleitung (w/m/d) mit Leitwerksfunktion WITTENSTEIN SE
Igersheim-Harthausen Zum Job 
GOLDBECK SOLAR GmbH-Firmenlogo
Bauleiter (m/w/d) PV-Dachanlagen GOLDBECK SOLAR GmbH
deutschlandweit Zum Job 
Schleifring GmbH-Firmenlogo
Vertriebsingenieur Maschinenbau & Elektrotechnik (m/w/d) Schleifring GmbH
Fürstenfeldbruck Zum Job 
Landesbetrieb Straßenbau und Verkehr Schleswig-Holstein-Firmenlogo
Bauingenieurin / Bauingenieur (w/m/d) für den konstruktiven Ingenieurbau im Geschäftsbereich 3 "Erhaltung, Kompetenzzentrum Brücken" Landesbetrieb Straßenbau und Verkehr Schleswig-Holstein
Rendsburg, Lübeck, Kiel, Itzehoe, Flensburg Zum Job 

KI-Hardware-Not macht erfinderisch: Nvidias GPUs unterliegen Embargo

Statt auf westliche Hochleistungs-GPUs wie die Nvidia A100 oder H100 zurückzugreifen, setzt China auf neue, eigens entwickelte Asics (Application-specific integrated circuits) und Risc-V-basierte Prozessoren, die speziell für KI-Operationen optimiert sind. Zwar erreichen diese Chips nicht die Leistung westlicher High-End-Produkte. Da sie durch Softwareoptimierungen effizient genutzt werden, bleibt die Gesamtleistung dennoch konkurrenzfähig. Ein zentraler Punkt scheint die Eigenentwicklung von Hardware zu sein. Mit massiven Investitionen in die Halbleiterindustrie wurden Chips geschaffen, die speziell auf KI-Anwendungen zugeschnitten sind. Besonders die Prozessorarchitektur Risc-V ermöglicht es chinesischen Unternehmen, flexible und kostengünstige Chips zu entwickeln. Neben der Hardwareoptimierung setzt China auf Softwareoptimierungen. Es wurden Algorithmen geschaffen, die ressourceneffizienter arbeiten als westliche Pendants. Verfahren wie Sparse Training und fortschrittliche Komprimierungsmethoden reduzieren den Rechenaufwand und damit die Abhängigkeit von Hochleistungshardware.

Kontrollmechanismen wurden vermutlich ebenfalls umgangen

Ein weiterer Ansatz, um die Folgen des Embargos abzumildern, ist der Einsatz von Clustersystemen mit Chips in mittleren Leistungsklassen. Statt eine zentralisierte Infrastruktur mit High-End-GPUs zu betreiben, hat China Netzwerke aus weniger performanten Prozessoren geschaffen, die in verteilten Systemen parallel arbeiten. Diese Cluster-Computing-Strategie wird durch spezialisierte Frameworks wie Mindspore oder Paddlepaddle optimal genutzt. Vermutet wird auch, dass China auf internationale Kooperationen und Umgehungsstrategien der Embargos setzt. Trotz strenger Kontrollen gelingt es chinesischen Unternehmen, moderne Technologien indirekt zu beschaffen. Dies geschieht durch Partnerschaften mit Ländern, die nicht am Embargo beteiligt sind, oder durch das Reverse Engineering importierter Produkte. Die Entwicklung von Deepseek V3 innerhalb einer relativ kurzen Zeitspanne deutet darauf hin, dass die Grundlagen früherer KI-Plattform zügig weiterentwickelt wurden. China hat vermutlich frühzeitig mit der Forschung an alternativen Hardware- und Softwarestrategien begonnen, um sich von westlicher Technologie unabhängiger zu machen.

Chinas Fähigkeit, trotz erheblicher Handelsbeschränkungen eine konkurrenzfähige KI zu entwickeln, zeigt, dass Einschränkungen oft als Ansporn für Innovationen dienen können. Die globalen Auswirkungen dieser Entwicklung sind noch nicht vollständig absehbar, doch es ist offensichtlich, dass der internationale Wettbewerb im KI-Sektor durch Deepseek erheblich an Dynamik gewonnen hat. Szeneexperten wie Anjney Midha, Mitbegründer und CEO der Augmented-Reality-Plattform Ubiquity6, äußerte sich bei X sogar überschwänglich: „Praktisch über Nacht hat sich Deepseek R1 zum Modell der Wahl für Amerikas Top-Universitäten von Stanford bis hin zum MIT entwickelt.“

Bei aller aktuellen Euphorie darf aber nicht vergessen werden, dass bei der Nutzung des chinesischen Sprachmodells Daten unkontrolliert auf chinesische Server fließen. Gerade bei vertraulichen und personenbezogenen Informationen ist das ein nicht zu vernachlässigender Faktor, den vor allem Unternehmen bedenken sollten.

Ein Beitrag von:

  • Elke von Rekowski

    Chefredakteurin der VDI energie + umwelt und freie Redakteurin der VDI nachrichten sowie Ingenieur.de, unter anderem für die Themen Elektronik und Telekommunikation. Als langjährige Technikjournalistin arbeitete sie für verschiedene Branchenmagazine und Fachzeitschriften. Außerdem ist sie Mit-Gründerin einer E-Health Nachrichtenplattform.

Zu unseren Newslettern anmelden

Das Wichtigste immer im Blick: Mit unseren beiden Newslettern verpassen Sie keine News mehr aus der schönen neuen Technikwelt und erhalten Karrieretipps rund um Jobsuche & Bewerbung. Sie begeistert ein Thema mehr als das andere? Dann wählen Sie einfach Ihren kostenfreien Favoriten.