如何量化中美 AI 產(chǎn)學(xué)研領(lǐng)域的差距?從人才和論文數(shù)量等維度觀測(cè),是一個(gè)較為客觀的衡量標(biāo)準(zhǔn)。
7 月 3 日消息,在 2025 全球數(shù)字經(jīng)濟(jì)大會(huì)上,全球首份基于高質(zhì)量論文數(shù)據(jù)系統(tǒng)分析人工智能十年科研演進(jìn)的報(bào)告——《全球人工智能科研態(tài)勢(shì)報(bào)告(2015-2024)》,現(xiàn)場(chǎng)還揭曉了五份聚焦全球人工智能科研人才的榜單。
該報(bào)告由聯(lián)合國(guó)工業(yè)發(fā)展組織投資和技術(shù)促進(jìn)辦公室與東壁科技數(shù)據(jù)有限責(zé)任公司(東壁科技數(shù)據(jù))聯(lián)合發(fā)布,基于東壁指數(shù)(Dongbi Index)評(píng)價(jià)體系,對(duì) 2015-2024 年間發(fā)表的 96961 篇人工智能領(lǐng)域文獻(xiàn)進(jìn)行深度分析。
報(bào)告中多位 AI 產(chǎn)學(xué)研大佬位列其中,《中國(guó)人工智能人才榜 TOP100》中的張祥雨,其身份是曠視科技研究院基礎(chǔ)模型組負(fù)責(zé)人,他的團(tuán)隊(duì)曾獲 CVPR2016 最佳論文獎(jiǎng),并多次問(wèn)鼎 ImageNet、COCO 等頂級(jí)視覺(jué)競(jìng)賽。代表作包括 Res Net、Shuffle Net 系列,已成為工業(yè)界廣泛應(yīng)用的基石技術(shù),Google Scholar 引用數(shù)高達(dá) 40000 多次。
同時(shí)躋身全球及中國(guó)百人榜、并任職于企業(yè)的研究者還有華為的田奇、王云鶴以及謝凌曦,商湯科技的王曉剛、石建萍,蔚來(lái)汽車(chē)的任少卿,以及 MiniMax 閆俊杰、Sand.AI 曹越等 AI 新銳企業(yè)的領(lǐng)軍人。
與此同時(shí),美國(guó)頂尖機(jī)構(gòu)中活躍著大量杰出的華人學(xué)者身影。全球 100 人榜單里,在美任職的 20 位學(xué)者中,華人學(xué)者占 10 位,除何愷明、楊明玄外,還有在卡內(nèi)基梅隆大學(xué)任職的朱俊彥等人。以及女性榜單中,11 位在美國(guó)任職的學(xué)者里有 3 位華人女性,包括斯坦福大學(xué)的李飛飛。
另一方面,中國(guó)也成為吸引全球 AI 人才的重要磁極?!秷?bào)告》顯示,從國(guó)家分布來(lái)看,盡管美國(guó)在全球 AI 人才聚集方面仍占據(jù)主導(dǎo)地位,谷歌、微軟、IBM、Meta 和亞馬遜超過(guò) 60% 至 90% 的人才均分布在美國(guó)。但中國(guó)展現(xiàn)出強(qiáng)勁的崛起態(tài)勢(shì),成為第二大人才聚集地,騰訊(94.6%)、阿里巴巴(90.2%)的人才高度集中于本土,微軟也在中國(guó)部署了 714 名人才,占其全球 AI 人才的 29.0%。
人工智能產(chǎn)業(yè)十年,三大階段演進(jìn)
東壁科技數(shù)據(jù)創(chuàng)始人、深圳大學(xué)特聘教授吳登生提到:" 從早期的多元探索,到深度學(xué)習(xí)的爆發(fā)式增長(zhǎng),再到如今的工程化落地與新興方向涌現(xiàn),這份報(bào)告勾勒出全球人工智能研究鮮明的階段性特征,發(fā)文量總體呈上升趨勢(shì),粗略可分為初始起步期 ( 2015-2016 年 ) 、快速發(fā)展期 ( 2017-2019 年 ) 、成熟高峰期 ( 2020-2023 年 ) 、波動(dòng)調(diào)整期 ( 2024 年 ) 。
2015-2016 年是初始起步期,全球 AI 年度論文數(shù)量出現(xiàn)了小幅下滑,從 2015 年的 4421 篇滑落至 2016 年的 3628 篇。" 這個(gè)階段就像是在技術(shù)森林中摸索," 吳登生形容道," 傳統(tǒng)研究中,機(jī)器學(xué)習(xí)是主流,沒(méi)有‘超級(jí)明星’,大家都在多元化嘗試。"
快速發(fā)展的黃金期出現(xiàn)在 2017-2019 年,此時(shí)論文數(shù)量迎來(lái) " 三連跳 ",至 2019 年一舉突破萬(wàn)篇大關(guān)。2017-2018 年是關(guān)鍵轉(zhuǎn)折點(diǎn),關(guān)鍵詞 " 深度學(xué)習(xí) " 熱度陡增,標(biāo)志著 AI 研究開(kāi)始從實(shí)驗(yàn)室的理論探索大規(guī)模走向?qū)嶋H應(yīng)用的廣闊天地。
隨后的 2020-2023 年是成熟高峰期,雖有 2022 年的短暫回調(diào),但 AI 科研整體呈現(xiàn)強(qiáng)勁勢(shì)頭。其中,2020-2021 年堪稱(chēng) " 深度學(xué)習(xí) " 的全面爆發(fā)季,2023 年論文量飆升至 17,074 篇,較 2015 年實(shí)現(xiàn)了近 4 倍的跨越式增長(zhǎng)。在這個(gè)階段,AI 工程化落地全面推進(jìn)。
進(jìn)入最近的 2024 年,數(shù)據(jù)則揭示出一個(gè)重要的調(diào)整信號(hào)—— 2024 年發(fā)文量回落至 14786 篇。" 這并非退步,而是學(xué)術(shù)研究的戰(zhàn)略聚焦," 吳登生表示,"AI 研究正告別‘廣撒網(wǎng)’,開(kāi)始進(jìn)入深度專(zhuān)業(yè)化與精準(zhǔn)應(yīng)用導(dǎo)向的新階段。"
另一方面,從技術(shù)演進(jìn)路徑看,2015 年到 2017 年主要集中在傳統(tǒng)機(jī)器學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)基礎(chǔ)研究方面,2018 年到 2020 年深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等應(yīng)用領(lǐng)域興起,2021 年至 2023 年,大型語(yǔ)言模型、生成式 AI、多模態(tài)模型成為研究前沿,再到 2024 年至 2025 年,可解釋性 AI、自適應(yīng)學(xué)習(xí)、多智能體系統(tǒng)等新興方向涌現(xiàn)。
中美 AI 差距在哪
榜單數(shù)據(jù)印證了中美在全球 AI 研究中的核心地位。《全球人工智能機(jī)構(gòu)榜 TOP100》顯示,中國(guó)機(jī)構(gòu)占據(jù) 38 席,美國(guó)機(jī)構(gòu)占 35 席。根據(jù)《人工智能領(lǐng)域科研態(tài)勢(shì)分析報(bào)告(2015-2024)》,中國(guó)科學(xué)院以 2386 名頂尖人才、4639 篇頂刊論文的體量展現(xiàn)出絕對(duì)的優(yōu)勢(shì),清華大學(xué)與北京大學(xué)分別以 1753 人和 1377 人的人才數(shù)和 4583 篇和 3609 篇的發(fā)文量緊隨其后,共同構(gòu)筑了中國(guó)頂尖研究機(jī)構(gòu)的 " 三駕馬車(chē) "。
《人工智能領(lǐng)域科研態(tài)勢(shì)報(bào)告(2015-2024)》則印證了美國(guó)的深厚底蘊(yùn),美國(guó)以 35117 篇論文(2534 篇核心論文)和超過(guò) 228 萬(wàn)次總被引位居全球?qū)W術(shù)影響力之首,遠(yuǎn)超其他國(guó)家。中國(guó)以 31694 篇論文(1557 篇核心論文)和約 94.9 萬(wàn)次總被引位居第二。
數(shù)據(jù)顯示,全球 AI 研究人才分布具有顯著的不均衡性和地域集中特征。美國(guó)和中國(guó)的研究人員數(shù)量合計(jì)占全球 57.7%,凸顯了兩國(guó)在該領(lǐng)域的主導(dǎo)地位。
中國(guó)的研究人員數(shù)量從 2015 年不足萬(wàn)人到 2024 年的 5.2 萬(wàn)人規(guī)模,以 28.7% 的年復(fù)合增長(zhǎng)率展現(xiàn)出驚人的張力。其中,中國(guó)科學(xué)院 3453 人、清華大學(xué) 2667 人、北京大學(xué) 2123 人,這些高校人才構(gòu)成了中國(guó) AI 人才第一梯隊(duì)。另一方面,騰訊、阿里巴巴等科技企業(yè)的研發(fā)團(tuán)隊(duì)分別以 992 人、633 人的規(guī)模超越部分實(shí)力高校。
美國(guó)以 6.3 萬(wàn)余人的人才數(shù)量居全球領(lǐng)先地位,其中,斯坦福大學(xué) 2385 人、麻省理工學(xué)院 2191 人,與谷歌 2569 人、微軟 2461 人形成高校企業(yè)雙引擎。
" 中國(guó)人才規(guī)模的增長(zhǎng)速度很快,以 5.3 萬(wàn)人緊追美國(guó)的 6.3 萬(wàn)人 ",吳登生對(duì)比數(shù)據(jù)指出," 這不僅是數(shù)量上的追趕,也是多維度的靠近。"
谷歌公司和微軟公司各有約 2500 名人工智能人才,穩(wěn)居第一梯隊(duì),占據(jù)了全球 AI 人才的主導(dǎo)地位。第二梯隊(duì)則由擁有 1640 名相關(guān)人才的美國(guó) IBM 公司,以及擁有 1249 名人工智能人才的美國(guó) Meta 公司占據(jù)。
來(lái)自中國(guó)的騰訊和阿里巴巴公司也表現(xiàn)突出,兩家公司分別擁有 992 名和 633 名人工智能人才,在全球競(jìng)爭(zhēng)中占據(jù)重要位置。
從論文數(shù)量來(lái)看,在機(jī)構(gòu)競(jìng)爭(zhēng)力層面,中國(guó)呈現(xiàn) " 國(guó)家隊(duì)引領(lǐng) " 的特征。中國(guó)科學(xué)院以 585 篇高影響力論文位居全球科研機(jī)構(gòu)榜首,清華大學(xué)、北京大學(xué)也進(jìn)入全球發(fā)文量前十。然而,企業(yè)端的差距較為明顯。美國(guó)頭部企業(yè)人均科研產(chǎn)出效率顯著領(lǐng)先,谷歌、微軟、Meta 三大科技巨頭的總發(fā)文量為 5896 篇,是中國(guó) TOP3 企業(yè)騰訊、阿里、華為的 1.8 倍,這背后是美國(guó)基礎(chǔ)研究數(shù)十年的沉淀,尤其在機(jī)器學(xué)習(xí)、自然語(yǔ)言處理等基礎(chǔ)領(lǐng)域,美國(guó)企業(yè)論文的平均被引頻次為 63.3 次,較中國(guó)企業(yè)的 55 次高出 15%。
《報(bào)告》還揭示了一個(gè)有趣的現(xiàn)象,即中美兩國(guó)企業(yè)在人工智能領(lǐng)域的研究上呈現(xiàn)出明顯的路徑分化特征。
2015-2024 年,美國(guó)企業(yè) AI 學(xué)術(shù)發(fā)文總量為 10,330 篇,而中國(guó)企業(yè)為 5,748 篇,美國(guó)企業(yè)發(fā)文量是中國(guó)企業(yè)的 1.8 倍,領(lǐng)先優(yōu)勢(shì)達(dá) 4,582 篇(79.7%)。這反映出美國(guó)企業(yè)在 AI 基礎(chǔ)研究投入和學(xué)術(shù)產(chǎn)出能力方面具有顯著的優(yōu)勢(shì)。
而平均發(fā)文量方面,美國(guó)企業(yè)平均發(fā)文 543 篇,中國(guó)企業(yè)平均發(fā)文 302 篇,美國(guó)企業(yè)在平均學(xué)術(shù)產(chǎn)出上同樣是中國(guó)企業(yè)的 1.8 倍。這表明美國(guó)企業(yè)單體研發(fā)實(shí)力也較中國(guó)企業(yè)具有明顯優(yōu)勢(shì)。
AI 作為技術(shù)密集型產(chǎn)業(yè),其學(xué)術(shù)研究也高度集中于頭部企業(yè),中美兩國(guó) TOP15 企業(yè)的發(fā)文集中度均超過(guò) 99%。
中國(guó)發(fā)文最多的前三名企業(yè)分別為騰訊(1,354 篇)、阿里巴巴(1,034 篇)和華為(885 篇),而美國(guó)前三名企業(yè)為谷歌(2,895 篇)、微軟(1,582 篇)、Meta( 1,419 篇)。
其中,美國(guó)谷歌公司發(fā)文量超過(guò)中國(guó)前兩名企業(yè)的總和,這體現(xiàn)了美國(guó)科技巨頭在 AI 基礎(chǔ)研究方面的深厚積累。
吳登生還提到關(guān)鍵發(fā)現(xiàn):" 美國(guó)形成了典型的‘人才旋轉(zhuǎn)門(mén)’機(jī)制,如卡內(nèi)基梅隆大學(xué)與當(dāng)?shù)仄髽I(yè)人才流動(dòng)率達(dá) 37%。而中國(guó)高校與企業(yè)間互通率不足 15%,這堵‘隱形墻’亟待打破。"
報(bào)告顯示,美國(guó) AI 研究展現(xiàn)出基礎(chǔ)理論扎實(shí)、技術(shù)創(chuàng)新驅(qū)動(dòng)和均衡發(fā)展的特點(diǎn),在機(jī)器學(xué)習(xí)、智能機(jī)器人、專(zhuān)家系統(tǒng)等基礎(chǔ)理論和技術(shù)創(chuàng)新領(lǐng)域擁有絕對(duì)優(yōu)勢(shì),研究注重底層突破和技術(shù)倫理,如 AI 安全與隱私保護(hù)。中國(guó) AI 研究呈現(xiàn)出鮮明的應(yīng)用導(dǎo)向和產(chǎn)業(yè)結(jié)合緊密的特點(diǎn),在計(jì)算機(jī)視覺(jué)、知識(shí)圖譜和自然語(yǔ)言處理方面具有相對(duì)優(yōu)勢(shì)。
" 中國(guó)在計(jì)算機(jī)視覺(jué)領(lǐng)域的論文數(shù)量比美國(guó)高 40.8%,知識(shí)圖譜領(lǐng)域高 50.1%,在自然語(yǔ)言處理領(lǐng)域也略有優(yōu)勢(shì)," 吳登生援引報(bào)告數(shù)據(jù)指出," 這與中國(guó)在自動(dòng)駕駛、互聯(lián)網(wǎng)應(yīng)用、知識(shí)管理方面具有龐大市場(chǎng)需求和豐富應(yīng)用場(chǎng)景密不可分。"
中國(guó)企業(yè)也在推薦系統(tǒng)、智能金融(如移動(dòng)支付)、自動(dòng)駕駛等強(qiáng)應(yīng)用、強(qiáng)落地的領(lǐng)域表現(xiàn)突出。此外,在智能算法、邊緣計(jì)算等新興探索領(lǐng)域,中國(guó)雖起步相對(duì)較晚,但也展現(xiàn)出良好的發(fā)展態(tài)勢(shì)。
中國(guó) AI 女性人才占比較低
報(bào)告揭示的人才性別失衡問(wèn)題引發(fā)關(guān)注。數(shù)據(jù)顯示,總樣本量為 13 萬(wàn)余人,男性科學(xué)家占比 79.9%,女性科學(xué)家占比 20.1%。其中,中美 AI 領(lǐng)域女性人才占比差異明顯。
" 最令人驚訝的差距在這里。" 吳登生直言," 中國(guó) AI 女性人才占比僅 9.3%,美國(guó) 20.1%,這個(gè)比例,中國(guó)在全球 Top20 中排名倒數(shù)第二,不及美國(guó)的一半。"
在中國(guó)頭部機(jī)構(gòu)中,清華大學(xué)女性人才占比 7.88%,北京大學(xué) 9.18%,而美國(guó)斯坦福大學(xué)、麻省理工學(xué)院的女性人才占比達(dá) 25%-30%。
性別差距在企業(yè)端更為突出。中國(guó)科技企業(yè) AI 團(tuán)隊(duì)女性僅占 6.1%,谷歌、微軟則女性占比達(dá) 18.7%。從全球范圍來(lái)看,新加坡以 36.6% 的女性占比位居首位,澳大利亞 28.7%、韓國(guó) 28.1% 緊隨其后。報(bào)告分析認(rèn)為,傳統(tǒng)文化觀念、科研評(píng)價(jià)體系對(duì)女性的隱性偏見(jiàn),以及高強(qiáng)度研發(fā)工作的性別適配性問(wèn)題,是導(dǎo)致 AI 人才性別結(jié)構(gòu)失衡的三大主因。
" 不過(guò),我們也發(fā)現(xiàn)了一處亮點(diǎn)。" 吳登生特意提到:" 在中國(guó) AI 領(lǐng)域,信息技術(shù)類(lèi)院校如西安電子科技大學(xué)和綜合性大學(xué)如四川大學(xué)的性別包容性優(yōu)于傳統(tǒng)工程院校,香港大學(xué)的國(guó)際化特征亦顯示制度環(huán)境對(duì)性別平等的促進(jìn)作用。說(shuō)明制度變革能打破傳統(tǒng)桎梏。"
活動(dòng)現(xiàn)場(chǎng)展示了全球 AI 人才熱力圖,可以清晰看到 " 核心 - 邊緣 " 的結(jié)構(gòu),在前 20 大區(qū)域中,亞洲地區(qū)占據(jù)重要比例,包括北京、香港、上海、深圳、新加坡、首爾等,表明亞太地區(qū)正在成為全球科技創(chuàng)新的重要增長(zhǎng)極。美國(guó)的紐約、硅谷地區(qū)、波士頓地區(qū)等傳統(tǒng)創(chuàng)新中心仍保持強(qiáng)大的人才吸引力。歐洲地區(qū)以倫敦、蘇黎世等為代表,展現(xiàn)了多元化的創(chuàng)新格局。
數(shù)據(jù)顯示,國(guó)家層面來(lái)看,美國(guó)在全球 AI 人才聚集方面占據(jù)絕對(duì)主導(dǎo)地位。谷歌、微軟、IBM、Meta 和亞馬遜超過(guò) 60% 至 90% 的人才均分布在美國(guó)。" 但中國(guó)正成為新磁極。" 吳登生表示,中國(guó)成為第二大人才聚集地,不僅吸引了本土騰訊和阿里巴巴的絕大部分人才,美國(guó)微軟也在中國(guó)部署了 714 名人才,占其總量的 29.0%。
深度學(xué)習(xí)主導(dǎo) 融合與工程化成未來(lái)可能趨勢(shì)
通過(guò)關(guān)鍵詞分析,報(bào)告清晰地描繪出人工智能核心技術(shù)路線的變化。
" ‘深度學(xué)習(xí)’無(wú)疑是過(guò)去十年的絕對(duì)主角," 吳登生介紹道。" 深度學(xué)習(xí) " 關(guān)鍵詞頻率累計(jì)增長(zhǎng) 84 倍,尤其在 2018-2023 年,年均增速高達(dá) 217%,展現(xiàn)出驚人的爆發(fā)力。但他也指出,"2024 年其增速首次降至 30%,進(jìn)入平臺(tái)期,預(yù)示著單靠模型規(guī)模擴(kuò)張的發(fā)展模式面臨瓶頸。"
在計(jì)算機(jī)視覺(jué)領(lǐng)域," 目標(biāo)檢測(cè) "(object detection)以高達(dá) 78% 的出現(xiàn)率成為該領(lǐng)域 " 最熱 " 關(guān)鍵詞。" 語(yǔ)義分割 "(semantic segmentation)在 2022-2023 年熱度登頂,標(biāo)志著計(jì)算機(jī)視覺(jué)技術(shù)形成了 " 目標(biāo)檢測(cè) - 語(yǔ)義分割 - 視覺(jué)應(yīng)用 " 的完整閉環(huán)。
機(jī)器學(xué)習(xí)基礎(chǔ)理論持續(xù)夯實(shí),"reinforcement learning" 等子領(lǐng)域在 10 個(gè)年度保持活躍,年均增長(zhǎng) 12%。語(yǔ)義理解相關(guān)關(guān)鍵詞如 "semantics" 在 2022 年后年均增長(zhǎng) 45%,預(yù)示著 " 認(rèn)知智能 " 可能是下一輪突破的焦點(diǎn)。
報(bào)告還揭示了基礎(chǔ)理論類(lèi)關(guān)鍵詞如 "machine learning"、"classification"、"clustering" 保持相對(duì)穩(wěn)定的熱度,體現(xiàn)了這些基礎(chǔ)概念的重要性。
新興技術(shù)崛起方面,"Transformers" 關(guān)鍵詞在 2022 年后異軍突起,深刻改變自然語(yǔ)言處理和多模態(tài) AI 領(lǐng)域。"Feature extraction" 和 "optimization" 等工程化關(guān)鍵詞在 2020 年后呈現(xiàn)持續(xù)升溫趨勢(shì),表明研究重心正從算法創(chuàng)新轉(zhuǎn)向工程優(yōu)化和實(shí)際部署,是技術(shù)成熟和產(chǎn)業(yè)需求雙重驅(qū)動(dòng)的結(jié)果。
此外,報(bào)告還揭示了不同技術(shù)領(lǐng)域之間的融合趨勢(shì)。報(bào)告發(fā)現(xiàn),傳統(tǒng)的計(jì)算機(jī)視覺(jué)關(guān)鍵詞(如 "object detection"、"segmentation")與深度學(xué)習(xí)關(guān)鍵詞(如 "neural networks"、"deep learning")在熱度變化上高度同步。" 這生動(dòng)體現(xiàn)了 AI 發(fā)展的‘融合’大趨勢(shì),孤島式研究已成過(guò)去時(shí)。" 吳登生總結(jié)道。(本文首發(fā)于鈦媒體 APP,作者 | 張帥,編輯 | 蓋虹達(dá))