周口信息網 > 熱點信息 > 正文

全國首個！“大模型標準符合性測試”結果公布，這四款國產大模型首批通過！

網絡整理 2024-05-27

（原標題：全國首個！“大模型標準符合性測試”結果公布，這四款國產大模型首批通過！）

日前，全國首個官方“大模型標準符合性測試”結果公布。百度文心一言、騰訊混元大模型、360智腦、阿里云通義千問四款國產大模型首批通過測試，符合《人工智能大規(guī)模預訓練模型第2部分：評測指標與方法》語言大模型的相關技術要求，通用性、智能性等維度達到國家相關標準。截至發(fā)稿，百度、阿里云、騰訊云和360均已官宣該消息。

四家大模型率先通過測試

據悉，“大模型標準符合性評測” 由中國電子技術標準化研究院發(fā)起，旨在建立大模型標準符合性名錄，引領人工智能產業(yè)健康有序發(fā)展。該評測對外征集了學術界、產業(yè)界幾十家頭部單位意見，圍繞多維度展開，涵蓋語言、語音、視覺等多模態(tài)領域，是基于官方大模型測試基準的權威評測。

記者查詢公開資料獲悉，今年8月31日，全國信息技術標準化技術委員會人工智能技術委員會秘書處就發(fā)布了啟動大模型標準符合性評測的通知。通知明確，將基于大模型測試基準，開展模型的理解能力、生成能力、安全性等維度評測，為評估大模型能力水平提供全面的測試報告。

在12月22日舉行的全國信息技術標準化技術委員會人工智能分委會全體會議上，“大模型標準符合性測試”結果公布，百度文心一言、騰訊混元大模型、360智腦、阿里云通義千問四家大模型率先通過測試。

中國信息通信研究院有關負責人此前曾表示，大模型作為產業(yè)智能化基座，在識別、理解、決策、生成等任務中表現出泛化性、通用性、遷移性潛力，與實體經濟深度綁定，在金融、工業(yè)、能源等領域進一步落地，持續(xù)釋放技術紅利。然而，當前大模型產品種類繁多、實際生產價值難以量化、能力判斷標準尚未統(tǒng)一，亟需通過標準符合性驗證等手段進行全面評價，推動產業(yè)高質量發(fā)展。業(yè)內人士分析，通過國家標準符合性測試，意味著相關大模型在通用性、智能性等方面達到國家標準，未來可以在更廣泛的場景中應用，滿足不同行業(yè)和用戶的需求。

四家大模型各有千秋

記者梳理發(fā)現，首批通過“大模型標準符合性測試”的大模型，均有各自的特點與優(yōu)勢。

百度文心一言是中國市場第一個公開發(fā)布的基于大語言模型的生成式人工智能產品。自今年3月16日發(fā)布以來，其基礎模型目前已經迭代到文心大模型4.0版本。在10月舉行的百度世界大會上，百度創(chuàng)始人李彥宏表示，文心4.0是迄今為止最強大的文心大模型，實現了基礎模型的全面升級，在理解、生成、邏輯和記憶能力上都有著明顯提升，綜合水平“與GPT-4相比毫不遜色”。

基于百度在搜索業(yè)務上的多年積累，文心一言在自然語言問答、文本寫作、創(chuàng)意內容生成等方面有比較突出的表現。百度集團副總裁吳甜在近期的一場公開演講中介紹，文心一言從數萬億數據和數千億知識中融合學習，訓練出優(yōu)秀的基礎模型，采用有監(jiān)督精調、人類反饋強化學習、提示等技術進一步優(yōu)化，具備知識增強、檢索增強和對話增強的特色技術優(yōu)勢。

阿里云通義千問是四家大模型中唯一的開源大模型。據阿里云介紹，通義千問大模型在全球擁有廣泛的開發(fā)者用戶和企業(yè)客戶，其性能表現及安全性得到了大范圍的公開檢驗。12月1日開源后，通義千問72B在10個權威基準評測中創(chuàng)下開源模型最優(yōu)成績，并力壓Meta公司的開源大模型Llama2登頂海外最具權威性的AI開源社區(qū)HuggingFace排行榜，此后又登上國內上海人工智能實驗室OpenCompass榜首，成為業(yè)界公認的性能最強開源大模型。

據了解，阿里云已開源通義千問18億、70億、140億、720億參數的4款大語言模型。阿里云首席技術官周靖人曾表示，開源生態(tài)對促進中國大模型的技術進步與應用落地至關重要，通義千問將持續(xù)投入開源，希望成為“AI時代最開放的大模型”，與伙伴們共同促進大模型生態(tài)建設。

騰訊混元大模型是四家中發(fā)布時間最晚的，于今年9月7日的2023騰訊全球數字生態(tài)大會上才正式亮相。據介紹，混元大模型擁有超千億的參數規(guī)模、超2萬億tokens的預訓練語料，具備強大的中文創(chuàng)作能力，復雜語境下的邏輯推理能力以及可靠的任務執(zhí)行能力。

值得注意的是，騰訊與其他大模型廠商相比，更強調行業(yè)應用和落地。在9月正式發(fā)布混元大模型以前，騰訊云早在6月就召開了發(fā)布會，正式公布行業(yè)大模型研發(fā)進展，并發(fā)布面向B端客戶的騰訊云MaaS（Model as a Service，模型即服務）解決方案。據介紹，騰訊云MaaS的技術底座是一系列的行業(yè)大模型，包括金融、政府、文旅、傳媒、教育等?；谶@些基礎模型，騰訊云的客戶只要加入自己的場景數據，就可以生成契合自身業(yè)務需要的“專屬模型”。

360智腦大模型則側重于安全性。360表示，公司自研的360智腦大模型擁有千億級參數規(guī)模，具備生成創(chuàng)作、多輪對話、邏輯推理等十大核心能力、數百項細分功能，覆蓋大模型應用全場景，綜合能力位列世界大模型第一梯隊，并依托360在安全領域的積累和優(yōu)勢，成為全國首個原生安全的大模型。

據360近日最新發(fā)布，360集團與統(tǒng)信軟件于近日達成戰(zhàn)略合作，將發(fā)揮各自優(yōu)勢，構建安全可控企業(yè)級大模型。據360介紹，雙方聯合打造的企業(yè)大模型將重點解決大模型安全可信可控等問題，360智腦大模型現擁有國內最為完善的安全機制，能夠把大模型在網絡安全、數據安全、算法安全、生成內容安全的風險降到最低。

責編：萬健祎

校對：蘇煥文

免責聲明：信息網轉載此文目的在于傳遞更多信息，不代表本站的觀點和立場。文章內容僅供參考，不構成投資建議。如果您發(fā)現網站上有侵犯您的知識產權的作品，請與我們取得聯系，我們會及時修改或刪除。

Tags：[db:TAG標簽](1533056)

轉載請標注：信息網——全國首個！“大模型標準符合性測試”結果公布，這四款國產大模型首批通過！

九九国产中文字幕_在线国内精品自线视频_国产最新看片在线_久碰免费视频在线观看

周口信息網 > 熱點信息 > 正文

全國首個！“大模型標準符合性測試”結果公布，這四款國產大模型首批通過！

猜你喜歡

九九国产中文字幕_在线国内精品自线视频_国产最新看片在线_久碰免费视频在线观看

周口信息網 > 熱點信息 > 正文

全國首個！“大模型標準符合性測試”結果公布，這四款國產大模型首批通過！

猜你喜歡

全國首個！“大模型標準符合性測試”結果公布，這四款國產大模型首批通過！