賽道 | 深蘭參賽團隊閃耀KDD2021國際賽事,榮膺專項競賽冠軍
2021-08-14ACM SIGKDD(國際數據挖掘與知識發現大會,簡稱KDD)是數據挖掘領域的頂級國際學術會議,由美國計算機學會(ACM)數據挖掘及知識發現專委會(SIGKDD)主辦,被中國計算機學會(CCF)推薦為A類國際學術會議。自1995年以來,KDD已連續成功舉辦了26屆,應運而生的KDD Cup更是數據挖掘領域最有影響力的賽事。
8月14日-18日,KDD 2021盛會于新加坡拉開帷幕。深蘭科技DeepBlueAI(DBAI)團隊積極參與今年賽事,并成為賽事焦點,成績表現出色,在Multi-dataset Time Series Anomaly Detection競賽中獲得冠軍。值得一提的是,前7名還包括華為諾亞方舟實驗室、阿里達摩院、海康威視、日立、三菱電機、日本產業技術綜合研究所和柏林洪堡大學等知名公司和高校的隊伍。比賽競爭非常激烈,吸引了超過500支隊伍積極參與,并接收了將近2000次有效結果提交。
賽事介紹
Multi-dataset Time Series Anomaly Detection
Multi-dataset Time Series Anomaly Detection競賽提供了250條時間序列,并且每條時間序列都包括一個異常點。主辦方希望選手們利用無監督或自監督的方法找到這些異常點的位置。
時序異常檢測旨在檢測數據中的意外或罕見事件項。它常用于許多工業應用,如運維、行業監控、產品價格在線監控等。
團隊成績
深蘭團隊名列首位
數據分析
這些時間序列中異常點的種類繁多,可能是點異常,也可能是群體異常,如下圖。單一方法很難找到所有文件的異常點,因此需要一個適用的框架或者好的集成方法。
圖表 1不同異常類型
競賽方案
針對這一競賽,DeepBlueAI團隊自主開發了一套高泛化性和靈活性的異常檢測框架TsaDetect。具體來說,每個時序會經過周期分析,多模型預測,評估和集成三個模塊。
圖表 2 TsaDetect 時序異常檢測框架
首先,分析輸入時間序列以提取基本信息和周期,這對于需要窗口大小的算法很重要。然后,時間序列信號通過不同的模型進行處理。所有模型都會生成時間序列殘差,這些殘差被傳遞到評估和集成模塊中。這些殘差被標準化為可比較并加權求和以產生最終的殘差。這一步中的權重由置信度決定,它表示模型在檢測該信號中的異常時的置信度。最后,異常位置由這個最終的殘差決定。
在檢測模型的選擇和開發上,主要專注于快速和穩定。我們最終采用了基于傅里葉變換的方法,matrix profile方法,以及改進的基于回歸的方法。每種方法都有自己的適用的異常類型,通過上述的框架整合起來,就得到了一個魯棒性,泛化性更強的檢測器。
總 結
2019年,深蘭團隊就在KDD Cup 2019 AutoML Track 挑戰賽中取得第一名的佳績,此次深蘭的再次奪冠證明深蘭秉承“技術先行,深耕基礎研究”的理念,在數據挖掘領域占據領先地位。而其自主研發的時序異常檢測框架,也為AI運維,AI時序監控等領域的實踐和落地開闊了思路。
-
8項冠亞季軍收官ECCV2020,深蘭獲三大視覺頂會挑戰賽大滿貫
計算機視覺 -
與騰訊、哈工大同臺競技,深蘭獲自然語言處理領域國際頂會NAACL2021冠軍
計算機視覺 -
捷報 | 深蘭科技“雙隊”出征CVPR2021 斬獲五冠共獲14項大獎
計算機視覺 -
2022CVPR傳捷報丨深蘭科技再度折桂,連續4屆獲得CVPR挑戰賽冠軍
計算機視覺 -
深蘭科技奪冠CCKS2022“帶條件的分層級多答案問答”評測任務競賽
自然語言處理 -
PK 656 個對手!深蘭科技在全球頂級AI賽事kaggle競賽中再次奪冠
計算機視覺 -
一冠三亞二季!深蘭科技在EMNLP2022國際頂級賽事再創佳績
數據挖掘 -
6個獎項!深蘭科技在CVPR 2023挑戰賽中再獲佳績
計算機視覺 -
6冠3亞2季!深蘭科技在RANLP2023國際賽事上斬獲11項大獎
計算機視覺