天天時(shí)訊:2023年最強(qiáng)悍的國(guó)產(chǎn)大模型,這幾家排名前四
ChatGPT火爆出圈帶火了通用人工智能大模型,據(jù)不完全統(tǒng)計(jì),截至2023年8月,僅國(guó)內(nèi)發(fā)布的大模型就多達(dá)156個(gè),在這些大模型中,表現(xiàn)優(yōu)異者有,濫竽充數(shù)者也有。
就去年8月份新華社研究院中國(guó)企業(yè)發(fā)展研究中心發(fā)布的《人工智能大模型體驗(yàn)報(bào)告2.0》、《麻省理工科技評(píng)論》發(fā)布的大模型評(píng)測(cè)報(bào)告、12月新華社研究院中國(guó)企業(yè)發(fā)展研究中心發(fā)布的《人工智能大模型體驗(yàn)報(bào)告3.0》等來(lái)看,在當(dāng)前的國(guó)內(nèi)各主流大模型,綜合性能排名前四的分別有以下幾個(gè):
《人工智能大模型體驗(yàn)報(bào)告2.0》評(píng)測(cè)結(jié)果
《麻省理工科技評(píng)論》評(píng)測(cè)結(jié)果
《人工智能大模型體驗(yàn)報(bào)告3.0》評(píng)測(cè)結(jié)果
1.科大訊飛星火認(rèn)知大模型
在《人工智能大模型體驗(yàn)報(bào)告2.0》中,以1013的綜合性能得分排名第一;
在《麻省理工科技評(píng)論》的大模型評(píng)測(cè)報(bào)告中,以81.5的得分榮獲中國(guó)“最聰明”大模型稱(chēng)號(hào);
在《人工智能大模型體驗(yàn)報(bào)告3.0》中,以1775的高分蟬聯(lián)冠軍,并獲得基礎(chǔ)能力指數(shù)、智商指數(shù)、工具提效指數(shù)三項(xiàng)評(píng)測(cè)指標(biāo)第一。
科大訊飛星火大模型發(fā)布于2023年5月6日,具備文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)、代碼、多模態(tài)等七大核心能力。其后,星火大模型多次升級(jí)迭代,目前最新版本為3.0。
10月份,為深入了解相關(guān)大模型的實(shí)際應(yīng)用情況,國(guó)務(wù)院發(fā)展研究中心國(guó)研經(jīng)濟(jì)研究院開(kāi)展了一項(xiàng)大模型行業(yè)應(yīng)用能力測(cè)評(píng)研究,旨在評(píng)估大模型不同行業(yè)下的表現(xiàn)情況,分析潛在的應(yīng)用場(chǎng)景和模式,對(duì)比我國(guó)大模型與國(guó)際一流大模型的行業(yè)表現(xiàn),并在此基礎(chǔ)上提出我國(guó)大模型產(chǎn)業(yè)高水平發(fā)展的政策建議。
選取的大模型包括:星火大模型3.0版、ChatGPT、GPT-4和國(guó)內(nèi)某大模型。
測(cè)評(píng)行業(yè)方面選擇了知識(shí)密集型的生產(chǎn)性服務(wù)業(yè)(法律服務(wù)與工業(yè)設(shè)計(jì))、個(gè)性化需求高的生活性服務(wù)業(yè)(醫(yī)療、教育與零售)以及部分制造業(yè)(汽車(chē)工程、計(jì)算機(jī)),并基于臨床執(zhí)業(yè)醫(yī)師資格考試、中醫(yī)執(zhí)業(yè)醫(yī)師資格考試、國(guó)家統(tǒng)一法律職業(yè)資格考試、機(jī)動(dòng)車(chē)檢測(cè)維修專(zhuān)業(yè)技術(shù)人員執(zhí)業(yè)資格、全國(guó)計(jì)算機(jī)技術(shù)與軟件專(zhuān)業(yè)技術(shù)資格等權(quán)威職業(yè)資格考試構(gòu)建了測(cè)評(píng)題目,以評(píng)估大模型在行業(yè)知識(shí)、技能掌握水平、生產(chǎn)經(jīng)營(yíng)場(chǎng)景理解能力等維度的表現(xiàn)。
評(píng)測(cè)結(jié)果顯示,星火大模型的綜合能力達(dá)到國(guó)際一流水平,所有7個(gè)測(cè)評(píng)行業(yè)中表現(xiàn)均大幅超越ChatGPT,并在部分行業(yè)優(yōu)于GPT-4,在與國(guó)內(nèi)某大模型的比較中也表現(xiàn)優(yōu)異。
特別是在醫(yī)療、法律、教育行業(yè),訊飛星火大模型表現(xiàn)格外突出,中文領(lǐng)域知識(shí)和語(yǔ)言理解能力已分別超越GPT4表現(xiàn)5.3%和4.1%,在教育領(lǐng)域基礎(chǔ)能力的表現(xiàn)與GPT4的表現(xiàn)差距小于1%。
2.百度文心一言
在《人工智能大模型體驗(yàn)報(bào)告2.0》和《麻省理工科技評(píng)論》發(fā)布的大模型評(píng)測(cè)報(bào)告中,百度文心一言分別以1010、72.5的得分位列第二,性能表現(xiàn)僅次于訊飛星火大模型。
據(jù)了解,百度文心一言發(fā)布于3月16日,主要能力包括文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解和多模態(tài)生成。
百度創(chuàng)始人、董事長(zhǎng)兼 CEO李彥宏在發(fā)布會(huì)上表示,雖然文心一言在內(nèi)測(cè)中并不完美,但是市場(chǎng)有需求必須推出來(lái)。
文心一言的技術(shù)原理是基于自然語(yǔ)言處理技術(shù)和深度學(xué)習(xí)技術(shù)。它通過(guò)建立海量的語(yǔ)料庫(kù)和深度學(xué)習(xí)算法,學(xué)習(xí)文章的句式、語(yǔ)言習(xí)慣、修辭手法、篇章結(jié)構(gòu)、時(shí)態(tài)語(yǔ)態(tài)等方面的知識(shí),從而可以根據(jù)用戶(hù)輸入的關(guān)鍵詞和需求,自動(dòng)生成符合語(yǔ)法和語(yǔ)義的文章段落和句子。
可實(shí)現(xiàn)的功能與科大訊飛星火、商湯商量等通用大模型類(lèi)似。不僅能和用戶(hù)聊天,還可以快速生成處理各種各樣的文本內(nèi)容,如文章、詩(shī)歌、歌詞、代碼、圖片等。
2023 年10 月 17 日,文心一言升級(jí)到4.0版本,理解、生成、邏輯、記憶四大能力得到提升。
3.商湯商量
在《人工智能大模型體驗(yàn)報(bào)告2.0》中和智譜AI-ChatGLM并列第三,綜合得分983分,在《麻省理工科技評(píng)論》發(fā)布的大模型評(píng)測(cè)報(bào)告中排名第三,得分68.3。在《人工智能大模型體驗(yàn)報(bào)告3.0》中得分1746,排名第二,并在定量實(shí)測(cè)的情商維度上,位居全部10款大模型第一,與在定性評(píng)估中,與訊飛星火大模型、智譜AI-ChatGLM一起選大模型市場(chǎng)未來(lái)領(lǐng)袖象限。
“商量”的寓意是“商量商量,都能解決”。
“商量”一名,實(shí)際上點(diǎn)出了ChatGPT類(lèi)模型的核心,即用戶(hù)在多輪對(duì)話(huà)中,通過(guò)“魔法”調(diào)教,挖掘大模型解決問(wèn)題的能力。
據(jù)悉,商湯商量于今年4月正式推出,是國(guó)內(nèi)最早推出的基于千億參數(shù)大語(yǔ)言模型的產(chǎn)品之一,并一直不斷迭代更新。
圍繞大模型及研發(fā)體系商湯以SenseCore商湯AI大裝置為基礎(chǔ),建立了一套工程化的體系來(lái)支撐大模型的快速迭代,軟件、系統(tǒng)和硬件都在以服務(wù)大模型快速迭代為目標(biāo)做研發(fā)配合,實(shí)現(xiàn)了敏捷、低成本、大批次地做模型迭代,有助于商湯發(fā)現(xiàn)大模型最好、最有效的生產(chǎn)配方。
4.智譜AI-ChatGLM
在《人工智能大模型體驗(yàn)報(bào)告2.0》中和商湯商量并列第三,綜合得分983分,在《人工智能大模型體驗(yàn)報(bào)告3.0》中得分1729,排名第三,在定性評(píng)估中,與訊飛星火大模型、智譜AI-ChatGLM一起入選大模型市場(chǎng)未來(lái)領(lǐng)袖象限。
ChatGLM 是由清華大學(xué)創(chuàng)新領(lǐng)軍工程博士張鵬帶領(lǐng)下的團(tuán)隊(duì)開(kāi)發(fā)的一個(gè)開(kāi)源且支持中英雙語(yǔ)的類(lèi) ChatGPT 大語(yǔ)言模型,發(fā)布于3月18日。
10月27日,智譜AI在2023中國(guó)計(jì)算機(jī)大會(huì)(CNCC)上推出了全新的ChatGLM3大模型,這款最新的模型采用了創(chuàng)新的多階段增強(qiáng)預(yù)訓(xùn)練方法,以實(shí)現(xiàn)更加充分的訓(xùn)練效果。
智譜AI的首席執(zhí)行官?gòu)堸i親自進(jìn)行了新品發(fā)布,并通過(guò)實(shí)時(shí)演示展示了產(chǎn)品的最新功能。據(jù)介紹,通過(guò)使用更豐富的訓(xùn)練數(shù)據(jù)和優(yōu)化的訓(xùn)練方案,ChatGLM3的性能得到了顯著提升。與之前的ChatGLM2相比,MMLU提升了36%,CEval提升了33%,GSM8K提升了179%,BBH提升了126%。
此外,ChatGLM3還進(jìn)行了針對(duì)GPT-4V的迭代升級(jí),引入了一些全新的功能。其中包括具備多模態(tài)理解能力的CogVLM-看圖識(shí)語(yǔ)義,在10余個(gè)國(guó)際標(biāo)準(zhǔn)圖文評(píng)測(cè)數(shù)據(jù)集上取得了領(lǐng)先水平;代碼增強(qiáng)模塊Code Interpreter能夠根據(jù)用戶(hù)需求生成并執(zhí)行代碼,自動(dòng)完成數(shù)據(jù)分析、文件處理等復(fù)雜任務(wù);網(wǎng)絡(luò)搜索增強(qiáng)模塊WebGLM-接入搜索增強(qiáng),能夠自動(dòng)查找互聯(lián)網(wǎng)上與問(wèn)題相關(guān)的資料,并在回答時(shí)提供參考的相關(guān)文獻(xiàn)或文章鏈接。
小結(jié):
盡管2023年,國(guó)內(nèi)大模型發(fā)展突飛猛進(jìn),涌現(xiàn)出不少標(biāo)桿產(chǎn)品,在行業(yè)應(yīng)用方面表現(xiàn)優(yōu)異,但我們也必須看到,人工智能技術(shù)的發(fā)展是一個(gè)持續(xù)的過(guò)程,需要不斷地進(jìn)行技術(shù)研發(fā)和創(chuàng)新。
探索賦能不同行業(yè)場(chǎng)景的落地方式將成為我國(guó)大模型企業(yè)快速發(fā)展的重要方向,而行業(yè)應(yīng)用價(jià)值也將成為評(píng)判大模型的核心指標(biāo)。唯有出現(xiàn)成千上萬(wàn)個(gè)解決生產(chǎn)、生活真實(shí)需求的AI原生應(yīng)用,大模型才能真正深入社會(huì)經(jīng)濟(jì)的各個(gè)角落,助力各行各業(yè)的產(chǎn)業(yè)升級(jí),推動(dòng)中國(guó)經(jīng)濟(jì)的快速?gòu)?fù)蘇,深刻改變?nèi)藗兊纳罘绞健?/p>
據(jù)公開(kāi)數(shù)據(jù),全球范圍內(nèi)人工智能將持續(xù)高速增長(zhǎng),市場(chǎng)規(guī)模持續(xù)擴(kuò)大,預(yù)計(jì)到2032年,全球人工智能市場(chǎng)規(guī)模將達(dá)到1.3萬(wàn)億美元。
在充滿(mǎn)活力和機(jī)遇的時(shí)代背景下,人工智能大模型的興起將持續(xù)引領(lǐng)科技進(jìn)步,無(wú)論是在技術(shù)創(chuàng)新、商業(yè)應(yīng)用還是在產(chǎn)業(yè)變革的推動(dòng)方面,大模型都將發(fā)揮重要作用。伴隨著應(yīng)用領(lǐng)域的不斷擴(kuò)展,為各產(chǎn)業(yè)發(fā)展帶來(lái)新的可能性。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。
關(guān)鍵詞:
責(zé)任編輯:hnmd004
- 天天時(shí)訊:2023年最強(qiáng)悍的國(guó)產(chǎn)大模型,這幾2024-01-15
- 天天新資訊:從高校出發(fā),原點(diǎn)參數(shù)看準(zhǔn)了一2024-01-15
- 上班族的廚房“神器”,蘇泊爾炒菜機(jī)cook32024-01-15
- 今日關(guān)注:華潤(rùn)紫竹毓婷品牌25年,陪你“毓2024-01-15
- “法治之路 強(qiáng)企之路” —— “中律捷”2024-01-15
- 廣州附大中醫(yī)院劉金良:腫瘤治療,補(bǔ)虛與散2024-01-15
- 電池測(cè)試檢測(cè)機(jī)構(gòu)有哪些?2024-01-15
- 環(huán)球熱資訊!科比特航空主導(dǎo)完成制定雙項(xiàng)無(wú)2024-01-15
- 長(zhǎng)安華為合作消息持續(xù)發(fā)酵,阿維塔為何公認(rèn)2024-01-15
- 觀熱點(diǎn):本安科技獲科創(chuàng)空間大模型賦能,以2024-01-15
- 一嗨租車(chē)與東風(fēng)日產(chǎn)共同宣布達(dá)成戰(zhàn)略合作 2024-01-15
- 大唐融合基于工業(yè)互聯(lián)網(wǎng)的儲(chǔ)配運(yùn)管一體化平2024-01-15
- 固始警方打掉一聚眾賭博窩點(diǎn)抓捕32人2024-01-15
- 光山縣:文化合作社讓群眾精神“富”起來(lái) 2024-01-15
- 全球簡(jiǎn)訊:信陽(yáng)市中醫(yī)藥學(xué)會(huì)康復(fù)專(zhuān)業(yè)委員會(huì)2024-01-15
- 與新區(qū)共成長(zhǎng) | 從“夢(mèng)想田”到“創(chuàng)新田2024-01-15
- 何佳訊教授:中國(guó)科技高端品牌呼喚“新范式2024-01-15
- 今日聚焦!郭富城廣州演唱會(huì)再現(xiàn)“舞臺(tái)王者2024-01-15
- 歐派全屋定制:以高品質(zhì)服務(wù)推動(dòng)家居行業(yè)高2024-01-15
- 全球快消息!科龍空調(diào)小耳朵系列再添新品,2024-01-15
- 內(nèi)鄉(xiāng)縣大橋鄉(xiāng)全力擦亮民生“幸福底色”2024-01-15
- 環(huán)球快訊:內(nèi)鄉(xiāng)縣大橋鄉(xiāng)開(kāi)展人居環(huán)境集中整2024-01-15
- 唐河縣張店鎮(zhèn):筑牢節(jié)日食品安全防線-焦點(diǎn)2024-01-15
- 何佳訊:動(dòng)態(tài)品牌定位,戰(zhàn)略品牌管理新范式2024-01-15
- 潢川縣人社局:直播送崗位 服務(wù)暖民心2024-01-15
- 淮濱縣科工局:優(yōu)化營(yíng)商環(huán)境推進(jìn)項(xiàng)目建設(shè)2024-01-15
- 環(huán)球焦點(diǎn)!淮濱縣召開(kāi)政府與縣域金融機(jī)構(gòu)座2024-01-15
- 河南省張友琴名班主任工作室第四批成員見(jiàn)面2024-01-15
- 睿正咨詢(xún)《知人善“任”》新書(shū)發(fā)布,引領(lǐng)人2024-01-15
- 天天熱點(diǎn)!中勱商城四大優(yōu)勢(shì)賦能輕創(chuàng)業(yè)2024-01-15