【新聞晨報】上海本土AI企業深蘭科技刷榜NLP國際頂會挑戰賽,高比分奪魁
2023-12-06類似于體育界的奧運會,在國際頂會參賽也成為科研院所和科技巨頭的科技成果“試金石”。
近日,中國團隊再次刷新了人工智能自然語言處理領域國際頂級會議EMNLP 2023任務挑戰賽的榜單。在本次“PragTag-2023”和“Violence Inciting Text Detection(VITD)”兩項任務競賽中,中國科研機構深蘭科學院團隊以“國產自研“多個預訓練模型為基礎,并結合多種自然語言處理技術在與弗吉尼亞大學、加利福尼亞大學等美國知名高校在內的來自全球數十個團隊同場競技中脫穎而出,奪得兩項冠軍。據悉,這也是深蘭多次登頂該會議榜單。
其中,“PragTag-2023”任務競賽的要求,是在論文評審過程中,對同行評審內容中的每一句話,按照摘要、優點、不足、建議、結構、其他這六個類別進行分類,以實現評審內容細粒度的自動分類,并通過整合各方的評審意見,為經驗不足的評審人提供評議幫助,該項任務的主要難點在于可參考的數據量少,缺少統一的分類標準。
為此,深蘭技術團隊采用了兩個出色的預訓練模型“RoBERTa”和“DeBERTa”作為語言模型底座,在對其進行調整優化的基礎上,同時融入了諸如注意力池化、最大池化、多折交叉驗證、對抗訓練等技術,并經過多組數據實驗,通過使用多個模型投票得到結果的方式,解決了相關難題,贏得這項任務競賽的冠軍。
“Violence Inciting Text Detection(暴力煽動文本檢測)”任務競賽的內容,則是檢測社交媒體上的文本是否包含暴力信息,并按照主動暴力、被動暴力、非暴力三個類別做分類,目的是對發生在孟加拉國和印度西孟加拉邦的各種形式的社區暴力行為進行分類甄別,以及闡明發生這一復雜現象的緣由,并阻止同類事件的再次發生,緩解社會上的暴力傾向。
該任務的難點主要在于文本語言的特性,因為孟加拉語雖然有2億多的使用人口,但本身還是屬于小語種,使用范圍小,可參考的文本數據也少,同時孟加拉語有著句子普遍超長、文本差異小、語意語境難以辨別的特點,這就對計算機自然語言處理技術有著更高的要求。
為了解決以上難題,深蘭技術團隊采用了“分而治之”的策略。針對小語種問題,團隊選用了“XLM-RoBERTa”和“banglabert”兩個與孟加拉語的語言特點相適配的預訓練模型;為了解決句子超長的問題,則采用了多種裁剪策略分別進行實驗,不斷優化語句裁剪效果;為了提升語言預訓練模型的魯棒性,則通過在模型中加入注意力池化、最大池化、多折交叉驗證、對抗訓練、偽標簽、multi-sample dropout等技術,以增強模型承受故障和干擾的能力。
最終,深蘭團隊以0.004分的優勢,戰勝了包括弗吉尼亞大學、加利福尼亞大學、詹姆斯庫克大學等美國知名高校在內的來自全球的27支參賽隊伍,奪得該任務競賽的冠軍。
據悉,EMNLP與ACL、NAACL并稱為三大全球自然語言處理領域頂級會議,由ACL旗下SIGDAT組織,在Google Scholar計算語言學刊物指標中排名第二,每年匯集全球頂尖實驗室組隊參加,共同探討最新進展和成果。
-
【央視新聞】深蘭熊貓公交亮相首部反映交通運輸業史詩紀錄片《交通中國》
媒體報道 -
央視《新聞聯播》采訪深蘭科技陳海波:為可持續發展貢獻中國科技力量
媒體報道 -
【上觀新聞】長寧企業研發的這款“缺陷檢測設備”為制造業生產裝上“火眼金睛”!
媒體報道 -
【經濟日報】深蘭科技公司貫通基礎研究與應用開發——人工智能賦能傳統產業
媒體報道 -
【經濟日報】深蘭科技公司貫通基礎研究與應用開發—— 人工智能賦能傳統產業
媒體報道 -
【河南日報】深蘭機器人商丘制造基地在商丘市梁園區投產
媒體報道 -
樹洞救援武漢中心正式掛牌,深蘭用平臺和技術為公益賦能
公司新聞 -
深蘭科技開啟“海外名校產業博士計劃”,董事長陳海波被聘為上海交通大學博士生導師
公司新聞 -
出席第三屆“一帶一路”峰會的斯里蘭卡總統會見深蘭科技董事副總裁劉園桂一行
公司新聞 -
【每日經濟】專訪深蘭科技董事長陳海波:大模型如何助力人類從“碳基生命”走向“硅基生命”?
媒體報道 -
深蘭科技科研團隊6篇論文被國際醫學信息科學頂尖學術會議收錄
公司新聞 -
國家知識產權局公布《2023年度國家知識產權優勢企業名單》,深蘭科技成功入選
公司新聞 -
深蘭科技董事長陳海波擔任上海市科學技術協會常委
公司新聞 -
深蘭科技500輛智能駕駛巴士訂單落地 ,人民日報等多家央媒報道
媒體報道 -
泰國社會發展和人類安全部部長秘書率考察團到訪深蘭科技
公司新聞 -
深蘭科技與一帶一路(國際)研究院簽署國際市場合作協議
公司新聞 -
【36氪】深蘭科技發布國內首款個人記憶管理智能體——好記貓App
媒體報道 -
浦東創投集團參與完成深蘭科技數億元Pre-IPO輪投資
公司新聞 -
央企國家隊重磅出手!中交集團三大王牌集體"聯姻"深蘭科技
公司新聞 -
持續霸榜MedBench!深蘭科技醫療大模型綜合評測第一
公司新聞 -
強強聯合!中興通訊聯合深蘭科技發布新一代成熟商用“AI問診助手智能體”全場景解決方案,驚艷亮相2025世界人工智能大會
公司新聞 -
全球首發!深蘭科技AI玩偶:讀懂孩子情緒,開啟“人機共育”育兒新時代!
公司新聞 -
智啟新程,科創未來|熱烈祝賀深蘭科技集團新總部啟用
公司新聞