【智慧城市網(wǎng) 市場分析】AI大模型,指的是擁有數(shù)百萬以上參數(shù)規(guī)模的深度神經(jīng)網(wǎng)絡(luò)模型。這類模型在經(jīng)過專門的訓(xùn)練后,即可對海量數(shù)據(jù)進行復(fù)雜處理和任務(wù)處理。由OpenAI開發(fā)的ChatGPT之所以擁有強大的對話交互能力,背靠的正是名為“GPT”的AI預(yù)訓(xùn)練模型。
繼百度文心一言之后,三六零、阿里、華為、京東、騰訊等大模型陸續(xù)浮出水面,國內(nèi)AI大模型的追逐戰(zhàn)正在愈演愈烈。
4月7日,阿里云公開“阿里版GPT”通義千問邀測入口,引發(fā)強烈關(guān)注。4月11日,阿里云再放大招——阿里巴巴所有產(chǎn)品未來將接入“通義千問”大模型。與百度于3月中旬上線的“文心一言”大模型工具類似,“通義千問”也具備與用戶進行多輪對話的能力,并支持代碼編程、文案創(chuàng)作等功能。
4月8日,在人工智能大模型技術(shù)高峰論壇上,華為云人工智能領(lǐng)域首席科學(xué)家田奇介紹了盤古大模型的進展及其應(yīng)用狀況。據(jù)介紹,該模型利用了深度學(xué)習(xí)與自然語言處理技術(shù),并且采用海量中文語料庫對其進行培訓(xùn)。
同日,京東也宣布將在今年發(fā)布“ChatJD”,定位為產(chǎn)業(yè)版本ChatG。目前京東的大模型主要聚焦于文本、語音、對話和數(shù)字人生成等4個方面開展工作,比如給商品自動生成長度不等的文案,包括標題、賣點文案和直播文案等。
4月9日,360宣布,將基于360GPT大模型開發(fā)人工智能產(chǎn)品矩陣“360智腦”,未來將其率先落地在“360搜索”場景,后續(xù)面向電商、營銷、辦公等場景深度落地。
4月10日,商湯科技公布“日日新SenseNova”大模型體系雛形,并現(xiàn)場演示了該模型體系下“商量SenseChat”語言工具的超長文本閱讀理解、健康咨詢等創(chuàng)新能力。
同日,游戲起家的昆侖萬維也對外預(yù)告,不日將發(fā)布和奇點智源合作自研的大模型成果——“天工”3.5,并宣稱這是“中國第一個真正實現(xiàn)智能涌現(xiàn)的國產(chǎn)大語言模型”。
4月11日,字節(jié)跳動旗下辦公軟件飛書發(fā)布視頻,預(yù)告專屬智能助手“My AI”,區(qū)別于其他大廠的AI智能工具,“My AI”似乎無意再復(fù)制一個類似ChatGPT的語言大模型,更類似微軟推出的Office Copilot。
4月14日,騰訊云正式發(fā)布新一代HCC(High-Performance Computing Cluster)高性能計算集群。騰訊方面實測顯示,騰訊云新一代集群的算力性能較前代提升高達3倍,是國內(nèi)性能最強的大模型計算集群。
如今,包括百度、騰訊、阿里、華為、京東、360等多家國內(nèi)科技巨頭均已宣布在生成式AI產(chǎn)業(yè)有相應(yīng)布局,5月,騰訊混元大模型也即將發(fā)布。
與此同時,大模型在學(xué)術(shù)界也成了“香餑餑”。早在今年2月,復(fù)旦大學(xué)邱錫鵬教授團隊發(fā)布國內(nèi)首個類ChatGPT模型MOSS。3月,中國人民大學(xué)盧志武團隊自主研發(fā)多模態(tài)對話大模型并落地了第一款應(yīng)用“元乘象ChatImg”
根據(jù)公開信息不完全統(tǒng)計,目前國內(nèi)至少已經(jīng)有30多家大模型亮相,其中不乏參數(shù)規(guī)模甚至超過ChatGPT規(guī)模的大模型,廠商涵蓋了互聯(lián)網(wǎng)巨頭、AI上市公司、服務(wù)器龍頭企業(yè)、科研院所與一級市場創(chuàng)業(yè)公司。
此外,隨著ChatGPT的火爆,國內(nèi)還火速興起了AI大模型的創(chuàng)業(yè)風(fēng)潮。
2023年2月,原美團聯(lián)合創(chuàng)始人王慧文發(fā)布“AI英雄榜”,并火速啟動A輪融資;隨后,創(chuàng)新工場CEO李開復(fù)、前搜狗CEO王小川、前京東AI掌門人周伯文、出門問問創(chuàng)始人李志飛等掀起了AI大模型創(chuàng)業(yè)狂潮;阿里AI大牛賈揚清亦被爆出投身AI創(chuàng)業(yè);還有一系列整合AI的新產(chǎn)品雨后春筍般涌現(xiàn)。
可以預(yù)計,在中國規(guī)模龐大的互聯(lián)網(wǎng)用戶的支撐下,國內(nèi)企業(yè)在算法和算力上有望不斷實現(xiàn)突破并取得領(lǐng)先。從算力到應(yīng)用,已經(jīng)按下了AI大模型發(fā)展的加速鍵。
當前,國產(chǎn)大語言模型均未對公眾大面積開放,也沒有明確的ToC入口,未來發(fā)展大多也走ToB路線。
當前已正式上線的三家中,百度、商湯有關(guān)負責(zé)人曾向媒體表示,自家大模型為toB產(chǎn)品。阿里方面在4月11日舉辦的阿里云峰會上也宣稱,未來“通義千問”將主要面對企業(yè)定制個性化服務(wù)。
而在已有消息的幾家中,科大訊飛、網(wǎng)易有道兩家皆已透露了基于公司類GPT技術(shù)所要落地的產(chǎn)品;京東的“ChatJD”明確定位為產(chǎn)業(yè)版本ChatGPT;而華為“盤古”系列下的NLP大模型主要面向智能文檔搜索、智能ERP、小語種大模型等行業(yè),多處理類案檢索、企業(yè)財務(wù)異常檢測等商業(yè)場景。
整體看來,國內(nèi)大語言模型賽道的公司在開發(fā)模型后,更傾向于將相關(guān)模型嫁接到自家的C端服務(wù)中,或者走私有化部署、企業(yè)定制等路線。
而在與海外相同賽道的公司對比之后,不難得出第二個特點——相比海外,國內(nèi)廠商更傾向于“每家必備”一個大模型。
當前,海外頭部科技公司如OpenAI、谷歌等,其開發(fā)都以基礎(chǔ)模型(Foundation Models)為主,不管是ChatGPT、Gpt4,還是PaLM-E,都是類似AI基礎(chǔ)設(shè)施的基礎(chǔ)大模型。其他公司,要么索性走開源社區(qū)的路線,要么像美國云服務(wù)巨頭Salesforce一樣,直接與OpenAI合作接入ChatGPT使用。在某種程度上,可以說是“大家都在規(guī)定范圍里各自賺錢”。
國內(nèi)科技企業(yè)圍繞AI大模型上演“百團大戰(zhàn)”背后,誰能憑硬實力拔得頭籌?
IDC中國助理研究總監(jiān)盧言霞接受中新經(jīng)緯采訪時認為,當前各家公司密集發(fā)布大模型或公布大模型進展,主要還是被市場熱度倒逼的。“事實上,行業(yè)成熟期遠未到來,目前仍是起步階段。但這種密集發(fā)布會推動大模型技術(shù)的落地,加速商業(yè)化。”盧言霞說。
中國電子商務(wù)專家服務(wù)中心副主任、知名互聯(lián)網(wǎng)專家郭濤在接受證券日報采訪時表示:“目前,國內(nèi)AI大模型正處在從實驗室走向大規(guī)模商業(yè)化的早期階段,存在核心技術(shù)不成熟、成熟落地場景較少、生態(tài)系統(tǒng)不健全等突出問題。”深度科技研究院院長張孝榮也認為,國內(nèi)AI大模型研發(fā)的水平還在實驗室階段,相關(guān)算法尚未成型。
浙江大學(xué)國際聯(lián)合商學(xué)院數(shù)字經(jīng)濟與金融創(chuàng)新研究中心聯(lián)席主任盤和林進一步介紹道,大模型生成式AI是弱智能向強智能的跨越,國內(nèi)AI企業(yè)尚未跨越關(guān)鍵門檻。當前國內(nèi)AI主要是中小模型,比如人臉識別,圖像識別,簡單語音對話,語義理解,應(yīng)用范圍很廣,但在大模型應(yīng)用方面,一方面海外更成熟的AI如今很難在國內(nèi)落地,而國內(nèi)又缺乏相關(guān)產(chǎn)品,所以還沒有應(yīng)用。
值得注意的是,在大模型“百花齊放”的當下,大多數(shù)公司看到的是機會,但也不排除有些公司是“炒概念”。對于投資者來說,還需要仔細甄別其中的風(fēng)險。
民生證券研報認為,大模型表面不再稀缺后,實質(zhì)格局更像“太極拳”:易學(xué)難精。因為開源基礎(chǔ)以及大公司本身的算力儲備與資金實力,單純發(fā)布一個大模型門檻沒有市場想象那么高。但是能夠擁有高質(zhì)量數(shù)據(jù)場景助力持續(xù)迭代,使得逐步性能逼近ChatGPT的大模型預(yù)計最終仍是“鳳毛麟角”。市場會逐步凝結(jié)共識:得數(shù)據(jù)者得天下,數(shù)據(jù)是差異化競爭關(guān)鍵。
從國外AI大模型發(fā)展邏輯來看,當AI強大到一定地步,如GPT-4時,監(jiān)管就顯得很有必要。
當?shù)貢r間3月31日,意大利個人數(shù)據(jù)保護局宣布,從即日起禁止使用聊天機器人ChatGPT,并限制開發(fā)這一平臺的OpenAI公司處理意大利用戶信息。
隨后,4月3日,德國聯(lián)邦數(shù)據(jù)保護專員Ulrich Kelber表示,德國可能會效仿意大利,以數(shù)據(jù)安全方面的擔(dān)憂為由,屏蔽ChatGPT。
法國和愛爾蘭方面也聯(lián)系了意大利數(shù)據(jù)監(jiān)管機構(gòu),并討論了調(diào)查結(jié)果,同時,加拿大隱私專員辦公室(OPC)宣布開始調(diào)查ChatGPT背后的公司OpenAI,涉及“指控OpenAI未經(jīng)同意收集、使用和披露個人信息”等投訴。
不僅如此,多國企業(yè)和機構(gòu)也開始調(diào)查或采取措施限制使用該軟件。
3月末,韓國三星半導(dǎo)體部門發(fā)生了3起因員工在ChatGPT上輸入設(shè)備信息及重要會議摘要,導(dǎo)致公司機密外泄風(fēng)險陡增的事件。
臺積電、軟銀、日立、富士通、日本瑞穗金融集團等企業(yè)也開始限制ChatGPT等交互式人工智能服務(wù)在商業(yè)運作中的使用。
此外,摩根大通已經(jīng)限制員工使用ChatGPT,亞馬遜、微軟和沃爾瑪也已向員工發(fā)出警告,要求員工謹慎使用生成式AI服務(wù),埃森哲則警告員工不要將客戶信息暴露在ChatGPT中。
與此同時,另一個引發(fā)關(guān)注的焦點是,如今GPT-4可能具備“自我進化”的能力。前谷歌大腦研究工程師Eric Jang發(fā)現(xiàn),GPT-4能夠以合理的方式批評自己的成果,“AI是否能夠超越人類”這個終極難題再度浮現(xiàn)。
曾有微軟研究員發(fā)推說GPT-4根本無法寫出“不押韻”的詩歌。然而,當再去詢問GPT-4是否完成了任務(wù)。這時,它道歉后,生成了一個不押韻的詩,可以說是滿分。
似乎,人工智能發(fā)展到現(xiàn)在,已經(jīng)成為令人“不安”的存在。
國內(nèi)方面,國家互聯(lián)網(wǎng)信息辦公室就《生成式人工智能服務(wù)管理辦法(征求意見稿)》(簡稱《征求意見稿》)公開征求意見,《征求意見稿》共21條,從生成式人工智能服務(wù)商的準入,到算法設(shè)計、訓(xùn)練數(shù)據(jù)選擇、模型到內(nèi)容,以及用戶實名和個人隱私、商業(yè)秘密等方面提出了相關(guān)要求。這意味著,當下爆火的生成式AI產(chǎn)業(yè)將迎來首份監(jiān)管文件。
其中管理辦法涉及的生成式人工智能包括基于算法、模型、規(guī)則生成文本、圖片、聲音、視頻、代碼等內(nèi)容的技術(shù)。并對利用生成式人工智能產(chǎn)品提供聊天和文本、圖像、聲音生成等服務(wù)的組織和個人(簡稱“提供者”)的責(zé)任進行了規(guī)定。
對于生成式人工智能產(chǎn)品,提供者需要按照《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》對生成的圖片、視頻等內(nèi)容進行標識等。
在合理的控制下,大模型成為AI時代的基礎(chǔ)設(shè)施已是可以預(yù)見的事。在日趨激烈的國產(chǎn)AI賽道上,誰能更好地把控算法、算力、數(shù)據(jù)、產(chǎn)品、場景這五個維度,誰就能獲得更多的可能性。