NTT開發利用生成式AI忠實再現語音技術
【共同社1月18日電】NTT公司17日發佈消息稱,利用生成式人工智能(AI),開發了語音合成技術,可以忠實地再現某人的聲音和說話方式。預計不僅在互聯網上的虛擬空間“元宇宙”上使用,還將用於重現因疾病等而失語人士的聲音。面向商業化,NTT今後將用1~2年時間推進實證研究。
這項新技術通過把幾分鐘~10分鐘左右的語音數據輸入到機器中,來進行語音合成。據稱,不僅能夠高水平再現不同性別、不同年齡的聲音特徵,而且可以給同樣的語句配上“平靜”、“喜悅”和“悲傷”等感情變化後發聲。NTT還開發了簡易版技術,即使只有幾秒鐘的語音數據,也可以再現與本人相似的聲音。
近年來,AI語音合成技術迅速提升,國內外的開發工作有了進展,但也有報告稱出現了濫用語音實施詐騙和散佈虛假信息等問題。NTT負責人表示“將在今後的研究中,綜合考慮”對策。
據稱,今後除了在網絡空間使用外,還考慮搭載有分開居住的家人聲音的AI等相關服務。NTT表示,將利用約40年前開始反復研究的語言處理技術,加速開發擅長應對日語的生成式AI。(完)
文章引用自 https://tchina.kyodonews.net/news/2024/01/5d5db1f03f67-nttai.html