國產(chǎn)大模型:創(chuàng)新為道 落地為王
未來大模型產(chǎn)品的發(fā)展趨勢可能是通用大模型與垂直領域細分模型的結合。這不僅需要具備堅實的技術基礎,也需要大模型產(chǎn)品具有堅實的基于場景的應用。未來,從實踐中來,到實踐中去的“實用級”大模型將成為趨勢。
◎?qū)嵙曈浾?羅云鵬
快速準確地提煉各方觀點并輸出會議紀要、輔助醫(yī)生進行醫(yī)療影像診斷、在自動駕駛中進行路線決策……當前,大模型技術正惠及各行各業(yè)。
過去一周,國內(nèi)有關大模型的話題熱度持續(xù)攀升。9月7日,騰訊混元大模型正式對外亮相,至此國內(nèi)已有超過130個大模型。一個個大模型的背后,都離不開自主創(chuàng)新。
上半場:開展研發(fā)“馬拉松”
Token,大語言模型中最小的文本單位。騰訊混元大模型的這個文本單位已躍升至超2萬億。
“騰訊混元大模型從零開始訓練,掌握了從模型算法、機器學習框架,到人工智能基礎設施的全鏈路自研技術?!彬v訊集團副總裁蔣杰說,“從2021年開始,騰訊不斷加大對技術研發(fā)的投入,這是不斷積累的過程?!?/p>
大模型的研發(fā)無疑是一場“馬拉松”。復旦大學中國研究院副研究員劉典認為,人工智能的發(fā)展不是一蹴而就的,要繼續(xù)加強投入,堅持自主研發(fā)、自立自強,做好在人工智能領域“打持久戰(zhàn)”的準備。
一項來自騰訊內(nèi)部的數(shù)據(jù)顯示,從2021年開始,該集團先后推出了多個千億和萬億參數(shù)的大模型,并在實際應用中不斷優(yōu)化大模型底層算法開發(fā),提升工程能力。從2018年起,騰訊累計投入研發(fā)經(jīng)費超過2300億元,在全球獲得專利授權3.3萬件,申請專利總數(shù)超過6.6萬件。
不僅是互聯(lián)網(wǎng)頭部企業(yè),我國的“國家隊”也在大模型研發(fā)上不斷發(fā)力。
從2019年開始,中國科學院自動化研究所就多模態(tài)大模型領域開始攻關,通過對海量數(shù)據(jù)弱關聯(lián)圖文音數(shù)據(jù)的跨模態(tài)自監(jiān)督學習,于2021年9月正式發(fā)布了千億參數(shù)多模態(tài)大模型“紫東太初”?!皬乃惴ǖ接布?、算力,‘紫東太初’都是‘中國造’?!敝袊茖W院自動化研究所紫東太初大模型研究中心常務副主任王金橋此前在接受媒體采訪時說,“在國產(chǎn)軟硬件的支撐下,我們的大模型一樣能跑得很好、很快?!?/p>
2023年6月,科技部新一代人工智能發(fā)展研究中心發(fā)布《中國人工智能大模型地圖研究報告》。該報告顯示,從全球已發(fā)布的大模型數(shù)量來看,中國和美國大幅領先,超過全球總數(shù)的80%。
中國信息協(xié)會常務理事、國研新經(jīng)濟研究院創(chuàng)始院長朱克力認為,當前國家對民營經(jīng)濟高度重視,作為我國數(shù)字科技公司多年來重視科技創(chuàng)新的階段成果,大模型構成了我國加快實現(xiàn)高水平科技自立自強的重要力量。
百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在參加2023世界互聯(lián)網(wǎng)大會時也表示,更創(chuàng)新、更領先的國產(chǎn)大模型,可以為解決全球醫(yī)療衛(wèi)生、氣候變化、經(jīng)濟增長等重大挑戰(zhàn)提出“中國方案”。
下半場:聚焦服務千行百業(yè)
記者梳理發(fā)現(xiàn),時下,在大模型應用領域,阿里達摩院的“通義千問”、商湯科技的“商量”、中國科學院的“紫東太初”、抖音的“云雀”等均已在不同行業(yè)和領域落地應用。
“以大模型生成技術為核心,人工智能正在成為下一輪數(shù)字化發(fā)展的關鍵動力,也為解決產(chǎn)業(yè)痛點帶來了全新思路?!彬v訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示,大模型需要基于產(chǎn)業(yè)場景,與企業(yè)數(shù)據(jù)融合才能釋放出最大價值。
在9月5日舉行的2023百度云智大會上,李彥宏曾公開表示,模型本身是不直接產(chǎn)生價值的,基于基礎大模型開發(fā)出來的應用才是模型存在的意義。
上海財經(jīng)大學校長劉元春認為,中國作為世界第二大經(jīng)濟體,擁有超大規(guī)模市場和數(shù)字資源優(yōu)勢,并且已經(jīng)在數(shù)字技術和應用上取得了巨大成就,為中國的大模型提供了更深入、更豐富的落地場景以及能夠“持續(xù)訓練、終身學習”的環(huán)境。
據(jù)騰訊數(shù)據(jù),目前騰訊已和1.1萬家生態(tài)伙伴展開緊密合作,推出覆蓋100多個產(chǎn)業(yè)場景的行業(yè)解決方案,共同服務千行百業(yè)。而據(jù)百度數(shù)據(jù),已有500多家生態(tài)伙伴通過百度智能云千帆大模型平臺使用各類大模型服務,千帆大模型平臺月活企業(yè)數(shù)超過1萬家。
“大模型的價值在于應用?!鼻迦A大學人工智能研究院視覺智能研究中心主任鄧志東教授認為,大模型只有在多樣化的實際應用場景中賦能智能經(jīng)濟與智能社會的發(fā)展,才能找到產(chǎn)業(yè)價值,同時也才能成就其自身。
值得一提的是,今年6月,騰訊云推出了模型即服務(MaaS)解決方案,提供涵蓋模型預訓練、模型精調(diào)、智能應用開發(fā)等一站式的行業(yè)大模型服務,可根據(jù)客戶需求高效率、低成本地定制大模型及智能應用。
“未來大模型產(chǎn)品的發(fā)展趨勢可能是通用大模型與垂直領域細分模型的結合?!敝袊嗣翊髮W數(shù)字經(jīng)濟研究中心主任李三希認為,這不僅需要具備堅實的技術基礎,如大規(guī)模、高質(zhì)量、多樣化的語料庫,創(chuàng)新的大模型算法,自研的機器學習框架和強大的算力基礎設施等,也需要大模型產(chǎn)品具有堅實的基于場景的應用。未來,從實踐中來,到實踐中去的“實用級”大模型將成為趨勢。
[相關新聞]
在場景中發(fā)現(xiàn)應用需求
科技日報訊 (記者華凌)大模型未來將如何為產(chǎn)業(yè)賦能?9月15日記者獲悉,由中國人民大學國家發(fā)展與戰(zhàn)略研究院、中國人民大學經(jīng)濟學院、中誠信國際信用評級有限責任公司聯(lián)合主辦的CMF宏觀經(jīng)濟熱點問題研討會(第73期)于近日舉行,多位知名學者、專家圍繞大模型未來的發(fā)展方向、人工智能發(fā)展對經(jīng)濟的意義等問題展開討論。
復旦大學人工智能創(chuàng)新與產(chǎn)業(yè)研究院院長,阿里巴巴原副總裁漆遠指出,大模型不僅具有更強的泛化能力,而且能更好地推動產(chǎn)業(yè)發(fā)展,提升用戶交互水平。因此,大模型未來的發(fā)展方向可能是在場景中找到真正需要的產(chǎn)品,將產(chǎn)品與算法和工程化真正結合起來。
未來,人工智能在金融、醫(yī)療、教育、游戲設計等行業(yè)應用落地的可能性將非常大。從產(chǎn)業(yè)發(fā)展趨勢上看,大模型產(chǎn)業(yè)當前正處于商業(yè)模式探索階段。實際上,它是一個生態(tài)系統(tǒng),需要產(chǎn)業(yè)、高校、服務平臺等層面的深度融合。
北京大學計算機學院教授、人工智能研究院副院長黃鐵軍指出,大模型具有規(guī)模大、通用性強的特點。同時,當大模型網(wǎng)絡參數(shù)達到百億級時,它就會成為一個復雜的系統(tǒng),并像其他的物理系統(tǒng)一樣產(chǎn)生涌現(xiàn)現(xiàn)象,具備融會貫通的能力。預計在未來3年內(nèi),視覺、聽覺、行動等通用智能的技術路線將會出現(xiàn),并且影響會更大;預計在未來10年內(nèi),智力革命成果會廣泛普及,一個全新的生態(tài)體系將構建出來;預計在未來30年內(nèi),人工智能將發(fā)展為時空環(huán)境驅(qū)動的具身智能,它能夠進行實時感知、實時決策、實時行動。(科技日報)
版權聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關法律責任。