DeepSeek-R1 enthüllt neues Modell „MODEL1“ zum einjährigen Jubiläum der Veröffentlichung
BlockBeats Nachrichten, am 21. Januar, laut einem Bericht von Quantum Bit, wurde anlässlich des einjährigen Jubiläums von DeepSeek-R1 das neue Modell „MODEL1“ vorgestellt. DeepSeek hat den FlashMLA-Code auf GitHub aktualisiert, in 28 von 114 Dateien wird MODEL1 erwähnt und erscheint als anderes Modell neben V32. Es ist bekannt, dass V32 DeepSeek-V3.2 ist, daher ist MODEL1 sehr wahrscheinlich eine neue Architektur. Die konkreten Unterschiede im Code zeigen sich im KV-Cache-Layout, im Umgang mit Sparsity und im FP8-Decoding, wobei es mehrere Unterschiede bei der Speicheroptimierung gibt.
Haftungsausschluss: Der Inhalt dieses Artikels gibt ausschließlich die Meinung des Autors wieder und repräsentiert nicht die Plattform in irgendeiner Form. Dieser Artikel ist nicht dazu gedacht, als Referenz für Investitionsentscheidungen zu dienen.
Das könnte Ihnen auch gefallen
Die europäischen Rüstungsaktien entwickeln sich uneinheitlich.
Im Trend
MehrDer bekannte Investor Ahmet Okumus hat kürzlich seine Anteile an Domo Inc. aufgestockt. Seine Investitionsentscheidung basiert auf einer klaren Einschätzung: Zum Zeitpunkt des Kaufs lag der Aktienkurs des Unternehmens deutlich unter seinem inneren Wert und war somit „unterbewertet“.
Die europäischen Rüstungsaktien entwickeln sich uneinheitlich.
