Lv.16
一家中國量化公司-幻方資本,在兩個月時間,用了H800是H100低效能GPU中國專用版,以550萬美元價格,訓練DeepSeek用起來跟數十億美元訓練的Chatgpt差不多,問DeepSeek是怎樣的模型,它回答,基於OpenAI的Chatgpt-4的架構的訓練模型。表示他的數據是源自於Chatgpt輸出的數據訓練而成,美媒認為可能有違反服務協議,甚至認為OpenAI的護城河正在縮小,對投資人來說,是否還需要高端GPU? 值得注意的是,DeepSeek暫時是目前唯一支持聯網搜索的推理模型,這使得DeepSeek的回答能夠結合最新的互聯網數據,相較其他模型準確性更強。 記者實測發現,當讓DeepSeek寫一份其創始人梁文鋒的簡歷時,它不僅能梳理出梁文鋒的基本信息、在浙江大學的教育背景以及量化投資領域的職業經歷,還能抓取到梁文鋒“2025年1月受邀參加國務院總理座談會,代表AI領域建言獻策”的最新媒體報道。
留言
讚
排序方式
最新
最舊
2/7