作為數(shù)據(jù)挖掘研究領(lǐng)域最具影響力的國際頂級賽事,素有“數(shù)據(jù)世界杯“之譽(yù)的KDD Cup日前正式公布了KDD Cup 2019三項(xiàng)重大賽事,包括Auto-ML Track、Regular ML Track及Humanity RL Track三場比賽,其中開賽22年以來首次引入的AutoML Competition挑戰(zhàn)賽受到不少學(xué)術(shù)及工業(yè)界專業(yè)人士的關(guān)注。
AutoML(Automated/Automatic Machine Learning,自動機(jī)器學(xué)習(xí))旨在研究在沒有專業(yè)知識的情況下、使用的低門檻甚至零門檻的機(jī)器學(xué)習(xí)算法,在AI人才緊缺的情況下,AutoML可以降低AI落地過程中對科學(xué)家的依賴,是 2014 年以來機(jī)器學(xué)習(xí)領(lǐng)域最炙手可熱的研究對象之一。2018年1月,谷歌高調(diào)推出自動機(jī)器學(xué)習(xí)產(chǎn)品Cloud AutoML,再次將這項(xiàng)技術(shù)推向更多人的視野中,目前AutoML已成為國內(nèi)外科技巨頭關(guān)注的焦點(diǎn)。由于日益受到學(xué)術(shù)界、工業(yè)界的廣泛關(guān)注, NeurIPS、IJCAI等學(xué)術(shù)頂會從去年開始將AutoML視為重點(diǎn)。本次KDD Cup選擇將其納入比賽內(nèi)容,并為此打破歷來數(shù)據(jù)挖掘方向賽事的傳統(tǒng),也是基于對AutoML技術(shù)發(fā)展趨勢和落地價(jià)值的認(rèn)可。對此,KDD Cup主席Taposh Dutta-Roy表示,AutoML是今年KDD關(guān)注的重點(diǎn),也是一項(xiàng)AI落地的關(guān)鍵技術(shù)。
據(jù)了解,本次KDD Cup AutoML挑戰(zhàn)賽由國內(nèi)AI獨(dú)角獸公司第四范式主辦,微軟、AutoML領(lǐng)域最權(quán)威的學(xué)術(shù)組織ChaLearn協(xié)辦,并為此次比賽設(shè)置了“史上”難度最高的比賽項(xiàng)目——基于時(shí)序關(guān)系型數(shù)據(jù)的AutoML。時(shí)序關(guān)系型數(shù)據(jù)在在線廣告、推薦系統(tǒng)、金融市場分析、醫(yī)療等應(yīng)用場景中非常常見,人們往往需要利用這樣的數(shù)據(jù)去構(gòu)建機(jī)器學(xué)習(xí)模型,并應(yīng)用機(jī)器學(xué)習(xí)模型提升對應(yīng)業(yè)務(wù)的效果。賽事主要負(fù)責(zé)人、第四范式資深算法科學(xué)家涂威威表示這是AutoML比賽歷史上首次考慮時(shí)序關(guān)系型多表數(shù)據(jù),會重點(diǎn)考察AutoML在實(shí)際應(yīng)用場景中的能力,應(yīng)對關(guān)系型、時(shí)序等多表類型數(shù)據(jù)的挑戰(zhàn),探索AutoML解決實(shí)際問題的價(jià)值。競賽已于4月1日正式拉開帷幕,挑戰(zhàn)賽分Feedback(反饋)、Check(校驗(yàn))、AutoML(盲測)3個(gè)階段,最終根據(jù)AUC排名選出冠軍團(tuán)隊(duì),并在7月20日公布比賽結(jié)果。
值得一提的是,KDD Cup比賽向來由具備深厚學(xué)術(shù)積累和行業(yè)實(shí)踐的頂級企業(yè)或高校承辦,競爭極為激烈,歷屆承辦方有微軟、阿里等巨頭公司和卡耐基·梅隆大學(xué)等知名高校。本次第四范式能打破這一傳統(tǒng)獲得承辦權(quán),主要是基于其在AutoML領(lǐng)域的耕耘及成果。據(jù)悉,第四范式自2015年起開展AutoML研究,自主研發(fā)了自動特征組合(FeatureGo)、自動時(shí)序特征(TemporalGo)、自動深度稀疏網(wǎng)絡(luò)DSN(Deep Sparse Network)等AutoML關(guān)鍵性支撐技術(shù),并全球率先將AutoML應(yīng)用于工業(yè)界,構(gòu)建了反欺詐、個(gè)性化推薦等業(yè)務(wù)場景下的AutoML。根據(jù)公開材料,第四范式曾先后舉辦了PAKDD、NeurIPS等頂級學(xué)術(shù)會議的AutoML比賽,完成了從技術(shù)參與者到規(guī)則制定者的角色轉(zhuǎn)換。
AI技術(shù)的發(fā)展,興起于比賽,成功于行業(yè),此前ImageNet賽事推動了一大批CV公司的成長,并且極大地促進(jìn)了行業(yè)爆發(fā)。AutoML的產(chǎn)業(yè)發(fā)展延續(xù)了這個(gè)路徑,此次首登“數(shù)據(jù)世界杯”的比賽舞臺,KDD平臺將有望吸引更多“全球最聰明的大腦”參與到AutoML進(jìn)程中,AutoML或?qū)⒙涞赜诟鼜V泛的行業(yè)和場景,迎來新的發(fā)展高峰。