深度求索(DeepSeek)創(chuàng)始人梁文鋒。圖片來源央視網(wǎng)
“真沒想到,這幾天火遍全網(wǎng)的DeepSeek創(chuàng)始人梁文鋒,來自咱們湛江吳川!”1月27日,家住吳川梅菉的陳先生在朋友圈這樣說。
近日,中共中央政治局常委、國務院總理李強主持召開專家、企業(yè)家和教科文衛(wèi)體等領域代表座談會,聽取對《政府工作報告(征求意見稿)》的意見建議。其中,來自湛江吳川的AI初創(chuàng)公司深度求索(DeepSeek)創(chuàng)始人梁文鋒出席座談會,并現(xiàn)場發(fā)言。
此前的2024年12月,梁文鋒和團隊開發(fā)的大模型“DeepSeek-V3”發(fā)布,這款大模型以低成本、高性能以及開源模式迅速轟動硅谷、震驚全球,被海外稱作“來自東方的神秘力量”。
刷屏湛江人朋友圈的梁文鋒,有著怎樣的成長經(jīng)歷?1月27日,記者到吳川進行了深入尋訪。
“他自小成績優(yōu)異,對科技懷有濃厚興趣”
“梁文鋒的小學時光是在吳川城區(qū)梅菉小學度過的,這里也是他科技夢想起航的地方。”據(jù)曾在梅菉小學任教并擔任過梁文鋒班主任的李先生講述,梁文鋒的父母均為小學教師,他的父親在梅菉小學執(zhí)教。“我記得梁文鋒在梅菉小學六(3)班擔任學習委員,成績在班上名列前茅。”李先生說,1996年,梁文鋒以優(yōu)異的成績從梅菉小學直升至吳川一中,成為當時整個梅菉小學僅有的4名直升生之一。
李先生回憶說,梁文鋒在學習上有幾大特點:一是課堂高度專注,他總能聚精會神地聆聽老師的每一句話,生怕錯過任何一個知識點;二是積極回答問題,每當老師拋出問題,他總是第一個舉手回答;三是喜歡挑戰(zhàn)難題,具有刻苦鉆研的精神;四是善于總結學習方法,他總能迅速歸納老師的授課內(nèi)容,形成自己的知識體系。
李先生說,除了學業(yè)上的優(yōu)異表現(xiàn),梁文鋒還展現(xiàn)出了對科技的濃厚興趣。課后,他積極參與科技小活動,熱衷于制作航空、航海模型,動手實踐的能力比較強。印象中,梁文鋒在小學三、四年級的時候就愛好集郵,他集郵有一個特點是“以郵養(yǎng)郵”,就是收到郵票后拿去賣,賣后又集回,基本不用花父親的錢。
梁文鋒初中和高中階段均就讀于吳川一中,一直是學校里的“尖子生”,并在數(shù)學學科表現(xiàn)出極大天賦,初中時期就學完了高中數(shù)學,甚至開始學大學的數(shù)學,數(shù)學思維能力很強。據(jù)梁文鋒的一位初三老師回憶,初中時期的梁文鋒性格很文靜,但不是書呆子,他在學習上很有自己的“一套方法”,很注重勞逸結合,像是很輕易就可以學好每一個學科。
2002年,17歲的梁文鋒參加全國普通高考,以理科816分、吳川市第一中學“高考狀元”的成績考上浙江大學本科電子信息工程專業(yè),于2007年考上浙江大學信息與通信工程專業(yè)研究生。在大學期間,梁文鋒就與同學一起開始積累市場行情數(shù)據(jù)和探索全自動量化交易。
“他很有前瞻的眼光,完全是白手起家”
“讀書的時候,梁文鋒就經(jīng)常做課題實驗,學習刻苦,也熱愛足球。”據(jù)梁文鋒的一位高中同學兼好友陳先生介紹,大學時期,梁文鋒讀的AI工程專業(yè)前景并不明朗,但他很有前瞻的眼光。他說,梁文鋒完全是白手起家,創(chuàng)業(yè)以來還做過全自動繡花機等產(chǎn)品,不斷探索總結溯源。
陳先生還表示,梁文鋒的衣著打扮和為人處世都非常低調(diào),淳樸有善心,此前以個人名義捐了很多錢。
記者查詢官方信息了解到,DeepSeek,全稱“杭州深度求索人工智能基礎技術研究有限公司”,成立于2023年7月,由知名量化資管巨頭幻方量化創(chuàng)立。在硅谷,DeepSeek很早就被稱作“來自東方的神秘力量”,也是網(wǎng)上熱議的“杭州六小龍”之一。
真正讓DeepSeek火出圈的是2024年12月26日,這家公司宣布上線并同步開源的DeepSeek-V3模型,并公布了長達53頁的訓練和技術細節(jié)。它以1/11的算力、僅2000個GPU芯片訓練出性能超越GPT-4o的大模型。其總訓練成本只有557.6萬美元,而GPT-4o的約為1億美元,使用25000個GPU芯片。雙方的成本至少是10倍的差距。
在性能上,DeepSeek-V3在數(shù)學、代碼能力和中文知識問答方面還超過了ChatGPT-4o。國外獨立測評機構Artificial Analysis測試后,發(fā)出了“超越了迄今為止所有開源模型”的驚嘆;Meta科學家田淵棟感慨:“這是非常偉大的工作。”“性價比”是商業(yè)社會中的制勝法寶之一,DeepSeek也因創(chuàng)新的模型架構和史無前例的性價比被稱為“大模型界的拼多多”,引發(fā)字節(jié)、阿里、百度等大廠的大模型價格大戰(zhàn)。
另據(jù)悉,早在2015年,30歲的梁文鋒和朋友一起創(chuàng)辦了杭州幻方科技有限公司,立志成為世界頂級的量化對沖基金。2016年10月,幻方量化推出第一個AI模型,第一份由深度學習生成的交易倉位上線執(zhí)行。到2017年底,幾乎所有的量化策略都采用AI模型計算。2023年5月,38歲的梁文鋒宣布做通用人工智能(AGI)。同年7月,他正式創(chuàng)辦杭州深度求索人工智能基礎技術研究有限公司,就是DeepSeek公司,專注于AI大模型的研究和開發(fā)。從公開的工作經(jīng)歷和職業(yè)生涯來看,梁文鋒在量化投資和高性能計算領域具有深厚的背景和豐富的經(jīng)驗,創(chuàng)業(yè)范疇橫跨金融和人工智能領域。
梁文鋒此前接受采訪時曾表示,回望過去30多年IT浪潮,中國基本沒有參與到真正的技術創(chuàng)新里。被外界視為理想主義者的梁文鋒稱,“我們覺得現(xiàn)在最重要的是參與到全球創(chuàng)新的浪潮里去。”他說,“過去很多年,中國公司習慣了別人做技術創(chuàng)新,我們拿過來做應用變現(xiàn),但這并非一種理所當然。這一波浪潮里,我們的出發(fā)點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態(tài)發(fā)展。”









