首頁 > 科技 > 正文

揭秘全球首個站立式AI合成主播“逼真”之謎

2019-03-14 15:58:58 來源:千龍網

今年2月19日,搜狗公司與新華社新媒體中心聯合發布了全球首個站立式AI合成主播,新的AI合成主播將從過去的“坐著播新聞”升級成結合肢體動作的“站立式播報”。3月3日,全球首個AI合成女主播“新小萌”正式上崗新華社,而她的第一個工作任務,便參與到十三屆全國人大二次會議報道中。隨后,包括“今日俄羅斯”電視臺網站、英國Daily Mail、美國Futurism等多家海外媒體對此進行了大幅報道,并稱“近年來,中國已成為全球領先的人工智能發展中心之一”。

作為第一個登上兩會的AI合成女主播,人們在驚嘆和稱贊之余,對于其背后由搜狗所開發的人工智能技術都無比好奇:這個在鏡頭前播報新聞的“新小萌”,為什么會如此像真人?背后都應用了哪些“黑科技”?

為什么這個AI合成主播如此像真人?

2018年互聯網大會期間,搜狗與新華社聯合發布的全球首個AI合成主播初次亮相,引起了全球傳媒業和人工智能領域的極大關注。三個月來,首批入職新華社的一中一英兩位AI合成主播,已生產3400余條新聞報道,累計時長達一萬多分鐘,參與了包括第五屆世界互聯網大會、首屆進博會、2019春運、春節等若干重要報道,成為中國人工智能與傳媒業大膽融合并付諸規模化應用的典型案例。

據記者了解,初代AI合成主播由“搜狗分身”技術打造,這項技術讓機器首次做到逼真的模擬人類說話時的聲音、嘴唇動作和表情,并且將三者自然匹配,創造出人類的AI分身,進而幫助人類提高信息表達和傳遞的效率。

而首個入職新華社的全球首個站立式AI合成主播,在聲音、嘴唇動作和表情之外,利用“搜狗分身”技術繼續賦予AI合成主播肢體語言的能力,讓AI合成主播更加智能逼真。

3月初加入兩會報道的AI合成主播進一步采用了“搜狗分身”最新的wavernn波形建模技術,可以實現逼真的語音合成效果,讓AI的聲音更具有真實情感和表現力。而在圖像生成方面,新版的AI合成主播實現了更加逼真的表情生成、自然的肢體動作以及嘴唇動作預測等能力,完成了站立并可以做出肢體動作的主播形象,進一步提升了合成主播的表現力。

合成人類背后更多的“黑科技”

兩會期間AI合成女主播的首次登場亮相,所帶來的沖擊感是非同凡響的。和真人主播相比,通過“搜狗分身”技術打造的AI合成主播能夠不知疲倦地工作24小時,同時還掌握多國語言,大大提升了效率、降低了成本,宛如科幻大片成真的即視感。

據搜狗公司透露,隨著“搜狗分身”技術能力的不斷提高,AI合成主播的定制周期也大為降低,合成效果和穩定性也有著顯著提升。僅靠少量用戶真實音視頻數據,即可快速定制出高逼真度的分身模型,幫助媒體在融媒體轉型、新聞時效性、跨語種傳播能力等領域升級。此次發布會同時發布的全球首個AI合成女主播,正是“搜狗分身”技術持續復制不同類型、不同特點AI合成主播能力的一個體現。

根據搜狗和新華社達成的戰略合作協議,未來雙方還將在AI合成主播領域展開長期合作,更多的AI合成主播將不斷涌現,而這些主播播報的新聞也將會通過新華社客戶端、新華社微信公眾號、CNC等平臺與觀眾見面。可以預見,AI合成主播注定會成為AI時代信息資訊傳播鏈條最重要的一環。

搜狗CEO王小川介紹說,作為AI合成主播的技術核心,“搜狗分身”技術未來還將應用于娛樂、醫療、健康、教育、法律、金融等多個領域,通過提供個性化的行業解決方案,為不同職業賦能,從而提升整個社會的信息生產力,用AI科技來讓人類生活變得更加美好。

編輯: 賈斯曼

關鍵詞:

本網站由 財經產業網 版權所有 粵ICP備18023326號-29
聯系我們:85 572 98@qq.com