美圖與清華合作推出最大規(guī)模教程類行為數(shù)據(jù)集COIN

時(shí)間：2019-03-08 18:18 作者：金熙華

近日，美圖公司社交產(chǎn)品事業(yè)群視覺算法組與清華大學(xué)自動(dòng)化系智能視覺實(shí)驗(yàn)室合作，推出了業(yè)界最大規(guī)模教程類行為數(shù)據(jù)集COIN（COmprehensive INstructional video analysis），該論文已被計(jì)算機(jī)視覺與模式識(shí)別會(huì)議CVPR 2019錄用。

教程類行為視頻（Instructional Video）可以幫助使用者獲取完成各種行為任務(wù)的知識(shí)，但是現(xiàn)有教程類行為視頻數(shù)據(jù)集在規(guī)模性和多樣性都存在較大的局限性，難以應(yīng)用于現(xiàn)實(shí)生中的復(fù)雜場(chǎng)景。為此，美圖公司社交產(chǎn)品事業(yè)群視覺算法組與清華大學(xué)自動(dòng)化系智能視覺實(shí)驗(yàn)室合作提出了名為COIN的大規(guī)模教程類數(shù)據(jù)集，用于更全面的教程類行為視頻分析。

COIN數(shù)據(jù)集采用分層結(jié)構(gòu)，即第一層是領(lǐng)域（Domain）、第二層是任務(wù)（Task）、第三層是步驟（Step），其中包含與日常生活相關(guān)的11827個(gè)視頻，涉及交通工具、電器維修、和家具裝修等12個(gè)領(lǐng)域的180個(gè)任務(wù)，共778個(gè)步驟。

COIN數(shù)據(jù)集的分層結(jié)構(gòu)

COIN數(shù)據(jù)集的設(shè)計(jì)人員還開發(fā)了創(chuàng)新性的標(biāo)注工具，可以更高效更準(zhǔn)確地標(biāo)注視頻行為的步驟信息。此外，為了給數(shù)據(jù)集提供更準(zhǔn)確的基準(zhǔn)指標(biāo)，數(shù)據(jù)集開發(fā)人員還使用了SSN、R-C3D等評(píng)價(jià)方法對(duì)COIN數(shù)據(jù)集進(jìn)行了測(cè)評(píng)。

COIN數(shù)據(jù)集的步驟定位準(zhǔn)確率分析

目前，COIN數(shù)據(jù)集是業(yè)界規(guī)模最大、多樣性最豐富的教程類視頻數(shù)據(jù)集。該數(shù)據(jù)集在標(biāo)注結(jié)構(gòu)上采用分層的組織結(jié)構(gòu)，涵蓋了多種不同類型的教程類視頻。該數(shù)據(jù)集的提出，給復(fù)雜場(chǎng)景下視頻動(dòng)作時(shí)序定位（temporal localization）等問題的研究提供豐富的數(shù)據(jù)資源，有望加快推動(dòng)視頻行為分析與理解等相關(guān)領(lǐng)域的研究。

美圖公司社交產(chǎn)品事業(yè)群視覺算法組，是美圖社交化的重要算法團(tuán)隊(duì)之一。隨著“美和社交”戰(zhàn)略的發(fā)布，美圖秀秀從過去的純圖片處理軟件轉(zhuǎn)變?yōu)樯鐓^(qū)平臺(tái)。視覺算法組通過人工智能/深度學(xué)習(xí)算法，理解圖像和視頻內(nèi)容中的語(yǔ)義信息，為社區(qū)中推薦、搜索、反作弊和垃圾過濾等提供有力的技術(shù)支撐。幫助用戶處理圖片的同時(shí)，增加社交功能及軟件活性。

數(shù)據(jù)集鏈接：https://coin-dataset.github.io

国精产品99永久一区一区_欧美一区在线视频_久久视频免费观看_国产在视频线精品视频www666

美圖與清華合作推出最大規(guī)模教程類行為數(shù)據(jù)集COIN

相關(guān)話題

熱門推薦

關(guān)注排行榜

編輯精選