久久99热66热这里只有精品,欧美精品一区二区伦理电影,丰满人妻侵犯中文字幕日本一级

“三冠一亞”成最大贏家！深蘭首次參加CCKS 2020彰顯技術(shù)硬實力

2020-11-12

捷報頻傳，三冠一亞！11月12-15日，CCKS 2020（國內(nèi)知識圖譜和語義計算等領(lǐng)域的核心學(xué)術(shù)會議）在江西南昌成功舉行，深蘭科技DeepBlueAI團隊首次參加即斬獲“三冠一亞”的佳績，并是唯一獲得多個冠軍的隊伍，成為與會嘉賓和媒體關(guān)注焦點。

此次大會由中國中文信息學(xué)會語言與知識計算專業(yè)委員會主辦，主題為“知識圖譜與認知智能”，共設(shè)立8個相關(guān)主題的技術(shù)評測任務(wù)，旨在為研究人員提供測試知識圖譜與語義計算技術(shù)、算法及系統(tǒng)的平臺和資源，促進國內(nèi)知識圖譜領(lǐng)域的技術(shù)發(fā)展。

隨著互聯(lián)網(wǎng)科技飛速發(fā)展，人們逐漸從信息時代進入智能時代。知識圖譜作為承載底層海量知識并支持上層智能應(yīng)用的重要載體，在智能時代中扮演了極其重要的角色。其中，多模態(tài)知識圖譜的構(gòu)建，能夠讓基于知識圖譜的智能服務(wù)更好地理解真實世界的數(shù)據(jù)場景，進而更好地支撐各項上游任務(wù)和行業(yè)應(yīng)用，如推薦系統(tǒng)、語義搜索、智能問答等。

undefined

大會現(xiàn)場吸引眾多行業(yè)資深專家蒞臨現(xiàn)場

深蘭科技獲獎信息（點擊可看清晰獎狀）
新冠百科知識圖譜類型推斷

面向金融領(lǐng)域：事件主體抽取

基于標(biāo)題大規(guī)模商品實體檢索

面向中文短文本的實體鏈指
undefined
基于標(biāo)題大規(guī)模商品實體檢索(創(chuàng))

面對社會各行各業(yè)不斷涌現(xiàn)的科技需求，深蘭科技研發(fā)人員正在加速開展各項技術(shù)的突破研發(fā)。據(jù)了解，深蘭科技DeepBlueAI團隊此次奪冠的三個任務(wù)方案，分別可在電商、金融、輿情監(jiān)控等領(lǐng)域的應(yīng)用上發(fā)揮重要作用。

具體來說，深蘭科技DeepBlueAI團隊分別在 “新冠百科知識圖譜類型推斷”、 “面向金融領(lǐng)域的篇章級事件主體抽取”、“基于標(biāo)題的大規(guī)模商品實體檢索”這三個（子）任務(wù)中奪得冠軍；在“面向中文短文本的實體鏈指”任務(wù)中僅以0.00002分之差屈居亞軍；此外，本屆組委會還特別評選出每一任務(wù)至多一項的“創(chuàng)新技術(shù)獎”，專門用于鼓勵創(chuàng)新性技術(shù)的使用，深蘭團隊在“基于標(biāo)題的大規(guī)模商品實體檢索”的任務(wù)中再次脫穎而出。

綜上所述，從包括CCKS2020在內(nèi)的國內(nèi)外“頂會”賽題任務(wù)設(shè)置中不難發(fā)現(xiàn)，共同要點更注重于落地應(yīng)用性。如今人工智能已逐漸滲透到各個行業(yè)并轉(zhuǎn)化為實際應(yīng)用，深蘭早在成立之初就提出了“基礎(chǔ)研究與落地應(yīng)用”齊頭并進的理念，并取得有目共睹的成效。會議競賽的成績正是對現(xiàn)在及過往的檢驗，更是對今后不斷進取的鞭策，“人工智能服務(wù)民生”將是深蘭矢志不渝的奮斗目標(biāo)。

“三冠”詳細解讀：

一， “新冠百科知識圖譜類型推斷” 任務(wù)，要求從實體百科（包括百度百科、互動百科、維基百科、醫(yī)學(xué)百科）頁面出發(fā)，從給定的數(shù)據(jù)中推斷相關(guān)實體的類型。然而，大量類型信息以非結(jié)構(gòu)化文本形式呈現(xiàn)于網(wǎng)絡(luò)頁面中，文本處理難度大，抽取結(jié)果同時保證高準確度和覆蓋率仍然是個極大的挑戰(zhàn)。

應(yīng)對：針對數(shù)據(jù)集的特點，DeepBlueAI團隊構(gòu)建了數(shù)個基于BERT模型的文本分類器，并引入了多個外部數(shù)據(jù)集，最后將這些分類器進行融合得到最終判斷結(jié)果。實體類型是知識圖譜的重要組成，正確的實體類型是構(gòu)建一個高質(zhì)量知識圖譜的前提。

二，“事件”在金融領(lǐng)域是投資分析、資產(chǎn)管理的重要決策參考，也是知識圖譜的重要組成部分，而“事件抽取”是進行圖譜推理、事件分析的必要過程。在金融領(lǐng)域，“事件抽取”是一項十分重要的任務(wù)，也是自然語言處理領(lǐng)域一項比較復(fù)雜的任務(wù)，它的挑戰(zhàn)相當(dāng)部分體現(xiàn)在文本復(fù)雜上：輸入的文本可能是句子、段落或者篇章，不定長度的文本使得限制文本長度的模型無法使用。

應(yīng)對：“面向金融領(lǐng)域的篇章級事件主體抽取”任務(wù)中，DeepBlueAI團隊使用了多標(biāo)簽事件分類加實體識別pipeline模型，在標(biāo)準的多標(biāo)簽分類模型中加入了特征提取模塊，實體識別模型采用BERT-LSTM-CRF與閱讀理解投票融合的方式，最終以較大優(yōu)勢獲得第一。

三，“基于標(biāo)題的大規(guī)模商品實體檢索”是典型的語義識別類任務(wù)，在網(wǎng)購已成為一種生活方式的前提下，該技術(shù)發(fā)展具有非常實用的價值。商品標(biāo)題一般較短，上下文語境不豐富；用戶搜索時，文本口語化嚴重；商品標(biāo)題中存在很多變異指代，沒有給定的指代映射表，這些方面都需要對上下文語境進行精準理解，具有很大的挑戰(zhàn)。

應(yīng)對：DeepBlueAI團隊針對商品檢索任務(wù)采用召回-粗排-精排的總體方案，在召回階段放棄了bm25、dssm等主流召回技術(shù)，創(chuàng)新性地使用Triplet BERT模型進行召回，在排序階段采用基于BERT的二分類排序方式，檢索準確率達到0.88489。最終不但排名第一，還收獲了創(chuàng)新技術(shù)獎。

關(guān)于 CCKS

第十四屆全國知識圖譜與語義計算大會（CCKS: China Conference on Knowledge Graph and Semantic Computing）由中國中文信息學(xué)會語言與知識計算專業(yè)委員會主辦，主題是“知識圖譜與認知智能”，共設(shè)立8個相關(guān)主題的技術(shù)評測任務(wù)，旨在為研究人員提供測試知識圖譜與語義計算技術(shù)、算法及系統(tǒng)的平臺和資源，促進國內(nèi)知識圖譜領(lǐng)域的技術(shù)發(fā)展，此次大會吸引了包括華為、百度、騰訊、小米、北京大學(xué)、上海交通大學(xué)和浙江大學(xué)等知名企業(yè)和學(xué)府的團隊同臺競技。

新聞推薦

科研榮譽

“三冠一亞”成最大贏家！深蘭首次參加CCKS 2020彰顯技術(shù)硬實力