分享
國家互聯(lián)網(wǎng)信息辦公室準(zhǔn)許從事互聯(lián)網(wǎng)新聞信息服務(wù)業(yè)務(wù)的網(wǎng)站
互聯(lián)網(wǎng)新聞信息服務(wù)許可證編號:10120220005
中新經(jīng)緯>>科技>>正文

透視2025丨中國AI模型廠商已在特定領(lǐng)域形成一定優(yōu)勢

2024-12-26 19:18:24 中新經(jīng)緯

  編者按:2024漸行漸遠(yuǎn),2025源源而來。各行業(yè)如何應(yīng)變局,如何開新局?中新經(jīng)緯廣邀經(jīng)濟(jì)學(xué)者,梳理過去關(guān)鍵事件,展望新年潛在機(jī)遇,以期為您提供有價(jià)值的參考。

  中新經(jīng)緯12月26日電 (袁媛)2024年被稱為AI(人工智能)元年。在這一年里,關(guān)于AI的大事件不絕于耳:諾貝爾物理學(xué)獎頒發(fā)給AI領(lǐng)域科學(xué)家,英偉達(dá)市值一度超越蘋果、微軟,蘋果推出Apple Intelligence AI系統(tǒng)等等。

  而在AI大模型方面,最主要事件則是OpenAI推出多模態(tài)大模型ChatGPT-4o,這一版本具有實(shí)時處理和生成文本、音頻以及圖像等多種模態(tài)的能力,被譽(yù)為技術(shù)上一個巨大突破。

  事實(shí)上,中國在AI大模型方面也已有足夠競爭力。有數(shù)據(jù)顯示,中國在2024年自然指數(shù)科學(xué)貢獻(xiàn)榜單上名列前茅,而且2014年至2023年,中國生成式AI專利申請量居全球第一。此外,2024年中國生成式AI領(lǐng)域的私人投資較上一年增長更為顯著。

  而智源研究院近日發(fā)布最新一期FlagEval大模型評測。結(jié)果顯示,2024年下半年,國內(nèi)大模型發(fā)展更聚焦綜合能力提升與實(shí)際應(yīng)用,其中,多模態(tài)模型發(fā)展迅速,涌現(xiàn)了不少新的廠商與新模型。

  國內(nèi)廠商“全面開花”

  對于國內(nèi)大模型的發(fā)展趨勢,智源研究院智能評測組負(fù)責(zé)人楊熙表示,中國的AI模型廠商已經(jīng)在特定領(lǐng)域形成了一定優(yōu)勢!皣a(chǎn)模型在安全評測和用戶體驗(yàn)優(yōu)化方面的表現(xiàn)尤為突出,尤其是在用戶意圖識別和適應(yīng)性調(diào)整上,國內(nèi)廠商具備較大的競爭力!

  具體來看,語言模型主觀評測顯示,目前針對一般中文場景的開放式生成任務(wù),各大模型表現(xiàn)已趨于飽和。字節(jié)跳動、百度等國產(chǎn)模型表現(xiàn)優(yōu)異。不過,在邏輯推理、觀點(diǎn)表達(dá)等維度,國內(nèi)廠商仍需進(jìn)一步與國際巨頭看齊。此外,多模態(tài)模型發(fā)展迅速,特別是在視覺語言模型和文生圖、文生視頻等方向上取得突破——開源模型如阿里巴巴的Qwen系列在某些任務(wù)上表現(xiàn)出色。

  隨著AI模型能力的提升,隱私保護(hù)和安全問題日益成為業(yè)界關(guān)注的焦點(diǎn)。楊熙指出,在評測中,智源團(tuán)隊(duì)特別設(shè)計(jì)了“引誘問題”,以測試模型在隱私保護(hù)和數(shù)據(jù)安全方面的表現(xiàn),結(jié)果顯示,國產(chǎn)大模型在防護(hù)隱私數(shù)據(jù)方面表現(xiàn)較好。

  值得注意的是,整體來看,復(fù)雜場景的表現(xiàn)依然是國內(nèi)外所有模型的短板。而動態(tài)視頻場景中,模型普遍存在物體變形和物理規(guī)律認(rèn)知不足的問題。

  智源研究院副院長兼總工程師林詠華指出,未來的AI生態(tài)發(fā)展將更加注重應(yīng)用落地與動態(tài)評測。“技術(shù)的演進(jìn)不只是能力的疊加,更需要通過實(shí)際應(yīng)用場景反饋,促進(jìn)模型能力的深度提升!

  在她看來,商業(yè)化路徑也是模型發(fā)展中的一大難題。如何在確保開源精神的同時實(shí)現(xiàn)商業(yè)價(jià)值,是廠商必須面對的現(xiàn)實(shí)考驗(yàn)。從技術(shù)開發(fā)到應(yīng)用落地,這一過程需要更多的跨界合作和創(chuàng)新模式。

  楊熙則談到,看未來趨勢,小模型和大模型的端云結(jié)合將成為重要的發(fā)展方向!岸藗(cè)模型表現(xiàn)出色,而小模型通過精細(xì)化訓(xùn)練可以在特定任務(wù)中表現(xiàn)更優(yōu)。端云結(jié)合的方式,不僅能降低算力成本,還能為用戶提供更加靈活和高效的解決方案!

  模型測評的機(jī)遇與挑戰(zhàn)

  近年來,大模型技術(shù)的廣泛應(yīng)用催生了復(fù)雜的測評需求。從文本生成到圖像識別,從語音分析到多模態(tài)理解,模型測評正從學(xué)術(shù)研究走向產(chǎn)業(yè)化。上述智源研究院最新發(fā)布的FlagEval秋冬模型測評,評估了全球100多個開源和閉源模型的能力,并且首次加入了金融量化交易等應(yīng)用場景的專項(xiàng)評測。這些多元化的測評結(jié)果,在一定程度上為AI模型的能力邊界提供了標(biāo)尺。

  模型測評市場為何能引發(fā)關(guān)注?林詠華認(rèn)為,一方面,測評為企業(yè)提供了清晰的技術(shù)能力對比,有助于優(yōu)化資源配置。另一方面,測評結(jié)果為資本選擇投資對象提供了有力依據(jù)。在資本密集型的AI行業(yè)中,測評已成為“資本看得懂”的標(biāo)準(zhǔn)工具。此外,模型參與者格局日趨復(fù)雜,從傳統(tǒng)的學(xué)術(shù)機(jī)構(gòu)到全球科技巨頭,從互聯(lián)網(wǎng)大廠到創(chuàng)業(yè)公司,競爭的廣度和深度都在加劇。

  然而,模型測評也面臨多重挑戰(zhàn)。首先是數(shù)據(jù)問題。測評結(jié)果的準(zhǔn)確性和可信度,依賴于高質(zhì)量、多樣化的數(shù)據(jù)集。然而,數(shù)據(jù)孤島和數(shù)據(jù)泄露問題限制了評測的深度和廣度。此外,缺乏統(tǒng)一的評測標(biāo)準(zhǔn),也讓不同機(jī)構(gòu)的評測結(jié)果缺乏可比性。林詠華在談及這一問題時表示,“評測體系的開放性和科學(xué)性是關(guān)鍵,要實(shí)現(xiàn)統(tǒng)一標(biāo)準(zhǔn),仍需克服多方利益博弈的障礙。”

  在林詠華看來,隨著技術(shù)的不斷發(fā)展,單一任務(wù)測評正向多任務(wù)和多模態(tài)評測轉(zhuǎn)型。而隨著AI在醫(yī)療、教育、金融等領(lǐng)域的深度滲透,垂直領(lǐng)域的專項(xiàng)評測需求也在快速增長。(中新經(jīng)緯APP)

  中新經(jīng)緯版權(quán)所有,未經(jīng)授權(quán),不得轉(zhuǎn)載或以其他方式使用。

責(zé)任編輯:張芷菡

來源:中新經(jīng)緯

編輯:王永樂

廣告等商務(wù)合作,請點(diǎn)擊這里

未經(jīng)過正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究

中新經(jīng)緯版權(quán)所有,未經(jīng)書面授權(quán),任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用。
關(guān)注中新經(jīng)緯微信公眾號(微信搜索“中新經(jīng)緯”或“jwview”),看更多精彩財(cái)經(jīng)資訊。
關(guān)于我們  |   About us  |   聯(lián)系我們  |   廣告服務(wù)  |   法律聲明  |   招聘信息  |   網(wǎng)站地圖

本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。

未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。

[京B2-20230170]  [京ICP備17012796號-1]

違法和不良信息舉報(bào)電話:18513525309 報(bào)料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn

Copyright ©2017-2025 jwview.com. All Rights Reserved


北京中新經(jīng)聞信息科技有限公司