10 月 30 日,全球首個(gè)專為粵語而設(shè)的動(dòng)態(tài)評(píng)測平臺(tái)及生態(tài)系統(tǒng) CLEVA-Cantonese 推出。鳳凰衛(wèi)視旗下人工智能數(shù)據(jù)服務(wù)機(jī)構(gòu)——鳳凰智媒為其提供了第一批高質(zhì)量粵語數(shù)據(jù)。這個(gè)創(chuàng)新平臺(tái)通過提供公平、動(dòng)態(tài)且具參考價(jià)值的基準(zhǔn)評(píng)估,揭示各類大語言模型對(duì)粵語的支持程度,并為研究人員及開發(fā)者提供具參考價(jià)值的分析,加速粵語大語言模型的優(yōu)化及實(shí)際應(yīng)用。
此前,港中大語言與視覺實(shí)驗(yàn)室研發(fā)的 CLEVA 是目前公認(rèn)規(guī)模最大、涵蓋最全面的中文大語言模型評(píng)估基準(zhǔn)之一。CLEVA-Cantonese 在此基礎(chǔ)上,建立全球首個(gè)持續(xù)演進(jìn)的粵語大語言模型評(píng)估生態(tài)系統(tǒng)。
粵語是香港、廣東及海外華人生活地區(qū)的重要語言,但由于粵語語音語義的繁復(fù)多樣、口語和文字的巨大差異、以及獨(dú)特的文化背景等原因造成大模型對(duì)粵語的理解和支持能力較為欠缺。同時(shí),粵語是低資源語言,語料庫有限,所以收集更多高質(zhì)量的數(shù)據(jù),是提升大模型能力的基礎(chǔ)條件。