8月25日百度大腦語(yǔ)言與知識(shí)技術(shù)峰會(huì)在線上召開,百度聯(lián)合中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)中文信息學(xué)會(huì)共同發(fā)布“千言”數(shù)據(jù)共建計(jì)劃。同時(shí),百度技術(shù)委員會(huì)主席吳華發(fā)布了算力共享計(jì)劃,希望通過(guò)數(shù)據(jù)集的共建與算力的共享,與學(xué)界、產(chǎn)業(yè)界共同推進(jìn)技術(shù)進(jìn)步。
據(jù)了解,“千言”項(xiàng)目第一期已涵蓋7大任務(wù)、20余個(gè)中文開源數(shù)據(jù)集,由百度攜手哈工大、清華、中科院信息工程研究所等在內(nèi)的10所頂級(jí)高校、企業(yè)共同建設(shè)完成。
截至目前,第一期千言項(xiàng)目已涵蓋了7大任務(wù)、20余個(gè)中文開源數(shù)據(jù)集,包括開放域?qū)υ?、閱讀理解、機(jī)器同傳、情感分析、語(yǔ)義解析、信息抽取和文本相似度等。
吳華表示,在未來(lái)3年中,千言計(jì)劃面向超20個(gè)任務(wù),收集和建設(shè)不少于100個(gè)中文自然語(yǔ)言處理數(shù)據(jù)集,覆蓋多個(gè)領(lǐng)域。