Lv.7
### **研究人員以低成本快速訓練 AI 模型,挑戰 OpenAI** #### **日期** 2025年2月7日 #### **來源** The Verge #### **主要觀點** 1. **研究團隊開發 s1 模型,以低成本挑戰 OpenAI** - 斯坦福大學與華盛頓大學的研究人員在**26 分鐘內,以不到 50 美元的成本**,訓練出 s1 AI 模型。 - 該模型的表現與 OpenAI o1 模型相當,甚至在部分測試中優於 OpenAI。 2. **使用 Qwen2.5 模型與 Google AI 技術進行訓練** - 研究人員選擇**阿里巴巴開源模型 Qwen2.5** 作為基礎進行開發。 - 透過 Google Gemini 2.0 提供的答案,應用**知識蒸餾技術**,有效提升模型性能。 3. **硬體與計算資源需求大幅降低** - 研究團隊僅使用**16 顆 Nvidia H100 GPU** 進行訓練,相較 OpenAI 傳統方法大幅降低算力需求。 - 訓練成本約為**50 美元**,顯示大規模 AI 訓練可變得更具成本效益。 4. **性能表現:數學測試結果超越 OpenAI o1 模型** - 在競賽數學測試中,s1 模型的表現**比 OpenAI o1 高出 27%**。 - 研究人員表示,這表明 AI 訓練不一定需要龐大算力與資金投入。 5. **此研究可能改變 AI 模型訓練的行業格局** - 透過**開源模型與知識蒸餾技術**,中小型團隊也能開發高效 AI。 - 這可能促進更多 AI 領域的競爭,降低技術門檻,讓更多企業與研究機構參與 AI 開發。
留言
讚