隨著語(yǔ)言與智能領(lǐng)域的新發(fā)展,由中國(guó)中文信息學(xué)會(huì)(CIPS)、中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)和百度公司聯(lián)手舉辦的“2018機(jī)器閱讀理解技術(shù)競(jìng)賽”將于2018年3月1日正式開(kāi)啟報(bào)名通道。報(bào)名地址及賽事詳情請(qǐng)登錄2018機(jī)器閱讀理解技術(shù)競(jìng)賽官網(wǎng)http://mrc2018.cipsc.org.cn/。獲勝團(tuán)隊(duì)將分享總額10萬(wàn)人民幣的獎(jiǎng)金,并將在第三屆“語(yǔ)言與智能高峰論壇”上進(jìn)行技術(shù)交流和頒獎(jiǎng)。

機(jī)器閱讀理解的任務(wù)就是讓機(jī)器閱讀文本,回答和閱讀內(nèi)容相關(guān)的問(wèn)題,其中涉及到語(yǔ)言理解、知識(shí)推理、摘要生成等復(fù)雜技術(shù),極具挑戰(zhàn)。在當(dāng)今互聯(lián)網(wǎng)應(yīng)用中,智能搜索、內(nèi)容推薦、語(yǔ)音助手與智能客服等領(lǐng)域的發(fā)展,都大量依靠于機(jī)器閱讀理解閱讀真實(shí)問(wèn)題、真實(shí)互聯(lián)網(wǎng)材料,給出完整答案的AI能力。從海量真實(shí)數(shù)據(jù)中訓(xùn)練AI,是自然語(yǔ)言處理和人工智能領(lǐng)域的重要前沿課題。
為此,本次競(jìng)賽中將提供面向真實(shí)應(yīng)用場(chǎng)景的大規(guī)模中文閱讀理解數(shù)據(jù)集。數(shù)據(jù)集包含來(lái)自百度搜索的30萬(wàn)個(gè)真實(shí)問(wèn)題,每個(gè)問(wèn)題對(duì)應(yīng)5個(gè)候選文檔文本,以及人工撰寫(xiě)的優(yōu)質(zhì)答案。競(jìng)賽任務(wù)是對(duì)于給定問(wèn)題q及其對(duì)應(yīng)的文本形式的候選文檔集合D=d1, d2, …, dn,要求參評(píng)閱讀理解系統(tǒng)自動(dòng)對(duì)問(wèn)題及候選文檔進(jìn)行分析,輸出能夠滿(mǎn)足問(wèn)題的文本答案a。為了便于參賽選手快速了解競(jìng)賽任務(wù),競(jìng)賽還提供了兩個(gè)開(kāi)源的閱讀理解基線(xiàn)系統(tǒng),并采用ROUGH-L和BLEU作為評(píng)價(jià)指標(biāo)。
百度與CIPS、CCF聯(lián)合舉辦2018機(jī)器閱讀理解技術(shù)競(jìng)賽并開(kāi)放數(shù)據(jù)集,旨在為研究者提供學(xué)術(shù)交流平臺(tái),進(jìn)一步提升機(jī)器閱讀理解技術(shù)的研究水平,并希望更多研究者能夠利用數(shù)據(jù)集產(chǎn)出更好更優(yōu)質(zhì)的機(jī)器閱讀理解模型,推動(dòng)語(yǔ)言理解和人工智能領(lǐng)域技術(shù)研究和應(yīng)用的發(fā)展。對(duì)此,百度自然語(yǔ)言處理首席科學(xué)家兼百度技術(shù)委員會(huì)主席吳華表示,“我們希望能夠與領(lǐng)域內(nèi)的其他同行者一起,推進(jìn)機(jī)器閱讀理解技術(shù)和應(yīng)用的研究,使 AI 能夠理解人類(lèi)的語(yǔ)言、用自然語(yǔ)言與人類(lèi)交流,讓 AI 更‘懂’人類(lèi)。”
有數(shù)據(jù)顯示,中國(guó)人工智能人才缺口超過(guò)500萬(wàn),在自然語(yǔ)言處理技術(shù)成為人才競(jìng)爭(zhēng)核心領(lǐng)域之一的今日,百度通過(guò)開(kāi)展機(jī)器閱讀理解技術(shù)競(jìng)賽、百度之星開(kāi)發(fā)者大賽、PaddlePaddle AI大賽等多個(gè)人工智能行業(yè)競(jìng)賽并開(kāi)放海量?jī)?yōu)質(zhì)AI數(shù)據(jù)資源,正是希望攜手并賦能AI行業(yè)的優(yōu)質(zhì)人才,進(jìn)一步推動(dòng)人工智能領(lǐng)域的技術(shù)交流和發(fā)展,為研究者提供強(qiáng)大的學(xué)習(xí)驅(qū)動(dòng)力與創(chuàng)造力,培養(yǎng)與成就更多中國(guó)人工智能領(lǐng)域的精英技術(shù)人才,最終持續(xù)推進(jìn)中國(guó)AI產(chǎn)業(yè)的發(fā)展,讓越來(lái)越多的中國(guó)面孔亮相于人工智能領(lǐng)域的世界舞臺(tái)。
在此,百度誠(chéng)邀所有對(duì)AI數(shù)據(jù)集有興趣的技術(shù)人才了解和關(guān)注百度閱讀理解數(shù)據(jù)集。已公開(kāi)的閱讀理解數(shù)據(jù)集可以自由下載https://ai.baidu.com/broad/introduction?dataset=dureader,并通過(guò)平臺(tái)提交測(cè)試集結(jié)果進(jìn)行系統(tǒng)效果測(cè)試。除了閱讀理解數(shù)據(jù)集,百度AI公開(kāi)數(shù)據(jù)集計(jì)劃BROAD(Baidu Research Open-Access Dataset)還發(fā)布了視頻和圖像數(shù)據(jù)集,更多數(shù)據(jù)集參見(jiàn):https://ai.baidu.com/broad。
未來(lái),百度將繼續(xù)在AI人才培養(yǎng)中發(fā)揮重要作用,助力產(chǎn)學(xué)研各方開(kāi)展研究,增強(qiáng)我國(guó)在機(jī)器閱讀理解領(lǐng)域的影響力,讓人才成為AI領(lǐng)域持續(xù)領(lǐng)跑的強(qiáng)力引擎。
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類(lèi)作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。
相關(guān)推薦
- 華納云香港高防服務(wù)器150G防御4.6折促銷(xiāo),低至6888元/月,CN2大帶寬直連清洗,終身循環(huán)折扣
- 2025年國(guó)內(nèi)免費(fèi)AI工具推薦:文章生成與圖像創(chuàng)作全攻略
- 自媒體推廣實(shí)時(shí)監(jiān)控從服務(wù)器帶寬到用戶(hù)行為解決方法
- 站長(zhǎng)必讀:從“流量思維”到“IP思維”的品牌升級(jí)之路
- 從流量變現(xiàn)到信任變現(xiàn):個(gè)人站長(zhǎng)的私域運(yùn)營(yíng)方法論
- 傳統(tǒng)網(wǎng)站如何借力短視頻?從SEO到“內(nèi)容種草”的轉(zhuǎn)型策略
- AI時(shí)代,個(gè)人站長(zhǎng)如何用AI工具實(shí)現(xiàn)“一人公司”
- 個(gè)人站長(zhǎng)消亡論?從“消失”到“重生”的三大破局路徑