Bitget App
Mag-trade nang mas matalino
Buy cryptoMarketsTradeFuturesEarnSquareMore
Sa unang anibersaryo ng paglabas ng DeepSeek-R1, inilantad ang bagong modelo na "MODEL1"

Sa unang anibersaryo ng paglabas ng DeepSeek-R1, inilantad ang bagong modelo na "MODEL1"

BlockBeatsBlockBeats2026/01/21 00:01
Ipakita ang orihinal

BlockBeats balita, Enero 21, ayon sa ulat ng Quantum Bit, sa unang anibersaryo ng DeepSeek-R1 ay inilantad ang bagong modelo na "MODEL1". In-update ng DeepSeek ang FlashMLA code sa GitHub, kung saan sa 114 na mga file ay may 28 beses na nabanggit ang MODEL1, na lumalabas bilang ibang modelo kasama ang V32. Alam na ang V32 ay DeepSeek-V3.2, kaya't malamang na ang MODEL1 ay isang bagong arkitektura. Ang mga partikular na pagkakaiba sa code ay makikita sa KV cache layout, sparsity handling, at FP8 decoding, na may ilang pagkakaiba sa memory optimization.

0
0

Disclaimer: Ang nilalaman ng artikulong ito ay sumasalamin lamang sa opinyon ng author at hindi kumakatawan sa platform sa anumang kapasidad. Ang artikulong ito ay hindi nilayon na magsilbi bilang isang sanggunian para sa paggawa ng mga desisyon sa investment.

PoolX: Naka-lock para sa mga bagong token.
Hanggang 12%. Palaging naka-on, laging may airdrop.
Mag Locked na ngayon!