أصدرت DeepSeek ورقة بحثية جديدة بتوقيع Liang Wenfeng: اقتراح بنية mHC الجديدة لتعزيز استقرار تدريب النماذج الكبيرة
PANews 1 يناير: وفقًا لما ذكرته Jinse Finance، نشرت DeepSeek ورقة بحثية جديدة واقترحت بنية جديدة تُسمى الربط الفائق المقيد على متعدد الشعب (mHC)، وتهدف إلى معالجة المشكلات التي تواجه تقنية الشبكات الفائقة الربط (HC) مثل عدم الاستقرار في التدريب والقيود على قابلية التوسع الناتجة عن تدمير خاصية التعيين المتطابق. تقوم هذه البنية بإعادة خاصية التعيين المتطابق من خلال إسقاط مساحة الاتصال المتبقي لـ HC على متعدد شعب محدد، مع دمج تحسينات بنية تحتية صارمة لضمان الكفاءة، مما أدى إلى تحسينات ملحوظة في الأداء وقابلية التوسع الفائقة. تتوقع DeepSeek أن mHC، باعتبارها توسعة مرنة وعملية لـ HC، ستساهم في فهم أعمق لتصميم البنى الطوبولوجية، وتوجه تطوير نماذج الأساس نحو اتجاهات واعدة. الورقة البحثية كتبها Zhenda Xie (تشيندا شيه)، Yixuan Wei (ييشوان وي)، وHuanqi Cao كمؤلفين أول، كما أُدرج Wenfeng Liang ضمن قائمة المؤلفين.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like
XRP يستقر بالقرب من 1.38 دولار، والأسواق تترقب بيانات CPI الأمريكية
قال Nic Carter إنه يجب أن يركز BIP-360 على جودة التقنية وأهداف مقاومة الكم.
بنك إنجلترا يدرس تعديل قواعد الجنيه الإسترليني المستقر
