Kurz zusammengefasst

  • Chinas Z.AI hat ein bedeutendes Open-Source-Bildmodell veröffentlicht, das vollständig auf Chips von Huawei trainiert wurde.
  • Es verwendet ein hybrides autoregressives-Diffusionsdesign, das die Textgenauigkeit und die räumliche Kontrolle verbessert.
  • Die Veröffentlichung signalisiert Chinas Bestreben nach KI-Unabhängigkeit ohne US-GPUs.

Das chinesische KI-Unternehmen Z.AI hat am Mittwoch ein Open-Source-Bildgenerierungsmodell veröffentlicht, das vollständig auf Prozessoren von Huawei trainiert wurde. Dies markiert das erste Mal, dass ein bedeutendes KI-Modell seinen kompletten Trainingszyklus ohne amerikanische Hardware abgeschlossen hat.

Dieser Schritt unterstreicht eine mögliche langfristige Herausforderung für Nvidias Dominanz bei KI-Chips, da er zeigt, dass eines der führenden chinesischen KI-Unternehmen große Modelle trainieren kann, ohne auf in den USA gefertigte GPUs angewiesen zu sein.

Das Modell ist bereits zum Download verfügbar und liefert gute – wenn auch nach heutigen Maßstäben nicht beeindruckende – Ergebnisse in Bezug auf Ästhetik und kohärenten Text. Es zeigt jedoch laut unseren ersten Schnelltests ein ausgezeichnetes räumliches Verständnis.

Chinas Z.AI veröffentlicht erstes großes KI-Bildgenerierungsmodell, das ohne amerikanische Chips trainiert wurde image 0 Mit Z.AIs neuem Modell generiertes Bild.

Das in Peking ansässige Unternehmen, das letzte Woche bei seinem Börsengang in Hongkong 558 Millionen US-Dollar einsammelte, trainierte das Modell, genannt GLM-Image, auf Huaweis Ascend Atlas 800T A2 Servern unter Verwendung des MindSpore-Frameworks.

"Wir hoffen, dass dies der Community wertvolle Anhaltspunkte für die Erforschung des Potenzials heimischer Rechenleistung bieten kann", sagte Z.AI in einer Erklärung gegenüber der

South China Morning Post
.

Vorstellung von GLM-Image: Ein neuer Meilenstein in der Open-Source-Bilderzeugung.

GLM-Image verwendet eine hybride autoregressive plus Diffusionsarchitektur und kombiniert ein starkes globales semantisches Verständnis mit hoher visueller Detailtreue. Es erreicht die Gesamtqualität gängiger Diffusionsmodelle…

— Z.ai (@Zai_org) January 14, 2026

GLM-Image kombiniert autoregressive und Diffusionstechniken in einer hybriden Architektur mit insgesamt 16 Milliarden Parametern. Die autoregressive Komponente, basierend auf Z.AIs GLM-4 Sprachmodell, übernimmt das Verständnis von Anweisungen und die Bildkomposition, während ein Diffusionsdecoder feine Details ausarbeitet. Dieser Ansatz spiegelt Techniken wider, die vom neuesten Bildgenerierungsmodell gpt-image-1.5 von OpenAI verwendet werden, das im Vergleich zu reinen Diffusionsmodellen wie Stable Diffusion eine überlegene Texterstellung und bessere Befolgung von Vorgaben gezeigt hat.

Diffusionsmodelle erzeugen Bilder, indem sie von zufälligem visuellem Rauschen ausgehen und dieses schrittweise in ein Bild verfeinern, während autoregressive Modelle Bilder Schritt für Schritt aufbauen und jeden Teil basierend auf dem vorherigen vorhersagen. Diffusion glänzt bei der allgemeinen Realitätsnähe, kann aber bei Details wie Text oder Layout schwächeln, während autoregressive Modelle bei Struktur und Befolgen von Anweisungen besonders stark sind. Derzeit ist die Diffusion die führende Technik unter Open-Source-Bildgeneratoren für KI.

Neue Hybridsysteme kombinieren beide Ansätze, indem sie die autoregressive Generierung zur Planung des Bildes und die Diffusion zur Verfeinerung des Endergebnisses nutzen.

Chinas Z.AI veröffentlicht erstes großes KI-Bildgenerierungsmodell, das ohne amerikanische Chips trainiert wurde image 1 Bild: Z.AI

Die Veröffentlichung hat Gewicht für Z.AI, das 2025 von Washington auf die schwarze Liste gesetzt wurde, weil angeblich Verbindungen zum chinesischen Militär bestehen. Diese Einstufung schnitt das Unternehmen von Nvidias H100- und A100-Prozessoren ab. Jetzt hat Z.AI bewiesen, dass auf der schwarzen Liste stehende Unternehmen weiterhin wettbewerbsfähige KI-Systeme mit heimischer Hardware produzieren können – eine Entwicklung, die Peking schon lange zu demonstrieren sucht.

Kurz nach Z.AIs Ankündigung berichtete

Reuters
, dass chinesische Zollbehörden Agenten angewiesen hätten, Nvidia H200 Chips am Grenzübertritt zu hindern. Regierungsbeamte luden Technologieunternehmen zu Sitzungen ein, in denen ihnen mitgeteilt wurde, die Chips nur dann zu kaufen, wenn es unbedingt notwendig sei. Die Formulierungen, so Quellen, seien so scharf gewesen, dass sie „im Grunde derzeit ein Verbot“ darstellten.

Peking scheint signalisieren zu wollen, dass chinesische KI-Labore in der Lage sind, leistungsfähige Modelle ohne amerikanische Chips zu bauen, wodurch die Dringlichkeit für chinesische Firmen, Nvidia-Hardware zu horten, sinkt. Der H200, der etwa die sechsfache Leistung des H20-Chips bietet, den Peking bereits im August letzten Jahres blockiert hatte, hatte bei chinesischen Unternehmen Bestellungen von über zwei Millionen Stück zu je 27.000 Dollar ausgelöst.

Analysten des Center for Security and Emerging Technologies in Georgetown haben festgestellt, dass Chinas Chipstrategie darauf beruht, die geringere Leistung pro Chip durch riesige Cluster von Huawei-Prozessoren auszugleichen. Dieser Ansatz funktioniert, erfordert jedoch mehr Hardware, mehr Strom und mehr technischen Aufwand.

„Eine der wichtigsten Einschränkungen dieser Strategie ist Chinas Fähigkeit, genug Chips im eigenen Land zu produzieren, um die Lücke bei den Fähigkeiten auszugleichen und Schritt zu halten“, sagte die leitende Forschungsanalystin Hanna Dohmen gegenüber

CNBC
im November.

Laut Huaweis eigenem Fahrplan wird der nächste Chip der nächsten Generation im Jahr 2026 tatsächlich schlechter sein als das aktuelle Flaggschiff, was die reine Rechenleistung angeht. Solche Einschätzungen könnten jedoch unterschätzen, was chinesische Labore durch algorithmische Effizienz erreichen können, wie DeepSeek gezeigt hat, indem es mit weniger Chips wettbewerbsfähige Modelle durch Optimierung auf Assembler-Ebene trainierte.

Chinas Z.AI veröffentlicht erstes großes KI-Bildgenerierungsmodell, das ohne amerikanische Chips trainiert wurde image 2 Quelle: Council on Foreign Relations

Laut dem technischen Bericht des Unternehmens erzielte Z.AIs GLM-Image branchenführende Benchmark-Ergebnisse unter Open-Source-Modellen bei der Texterstellung und der Generierung chinesischer Schriftzeichen. Wer nicht über die passende Hardware verfügt, kann das Modell auch online testen – mit API-Zugang für 0,014 US-Dollar pro generiertes Bild oder über einen kostenlosen Hugging Face Space, der von Z.AI betrieben wird.

Z.AI wurde als erstes der chinesischen „KI-Tiger“, einer Gruppe von Startups, die große Sprachmodelle als Konkurrenz zu OpenAI und Anthropic entwickeln, an die Börse gebracht. Die Aktie ist seit der Notierung um etwa 80 % gestiegen, was auf das starke Investoreninteresse an chinesischen KI-Unternehmen wie DeepSeek oder Alibaba im Zuge Chinas Ambitionen für heimische Chips zurückzuführen ist.

Huawei bereitet sich unterdessen darauf vor, die Produktion seiner Ascend-Prozessoren in diesem Jahr stark zu erhöhen. Die Präsenz des Unternehmens auf KI-Konferenzen in ganz China ist gewachsen, da es versucht, sich als Rückgrat einer nationalen KI-Infrastruktur zu positionieren, die nicht mehr auf Santa Clara angewiesen ist.