
本站訊 11月7日下午消息,第五屆世界互聯(lián)網(wǎng)大會(huì)在浙江烏鎮(zhèn)拉開帷幕,在開幕當(dāng)天,搜狗公司CEO王小川、新華社副社長(zhǎng)劉思揚(yáng)、搜狗公司智能語音事業(yè)部總經(jīng)理王硯峰和主持人邱浩聯(lián)合發(fā)布AI合成主播。
據(jù)了解,AI合成主播由“搜狗分身”技術(shù)打造,可以讓機(jī)器以更逼真自然的形象呈現(xiàn)在用戶面前。 該技術(shù)能通過人臉關(guān)鍵點(diǎn)檢測(cè)、人臉特征提取、人臉重構(gòu)、唇語識(shí)別、情感遷移等多項(xiàng)前沿技術(shù),并結(jié)合語音、圖像等多模態(tài)信息進(jìn)行聯(lián)合建模訓(xùn)練后,生成與真人無異的AI分身模型。這項(xiàng)技術(shù)讓機(jī)器做到逼真的模擬人類說話時(shí)的聲音、嘴唇動(dòng)作和表情,并且將三者自然匹配。
以“AI合成主播”為例,用戶只需要輸入新聞文本,AI合成主播就能用和真人一樣的聲音進(jìn)行播報(bào),而在播報(bào)的過程中唇形、面部表情等也能與真人主播吻合。(辛苓)