平安科技申請音頻驅動數字人生成專利,能夠生成音脣同步的數字人視頻

金融界2024年12月5日消息,國家知識產權局信息顯示,平安科技(深圳)有限公司申請一項名爲“音頻驅動數字人生成方法和裝置、電子設備及存儲介質”的專利,公開號 CN 119071591 A,申請日期爲2024年8月。

專利摘要顯示,本申請實施例提供了一種音頻驅動數字人生成方法和裝置、電子設備及存儲介質,屬於金融科技技術領域。該方法包括:獲取用戶輸入的音頻信號和目標人臉視頻;對音頻信號進行特徵提取,得到音頻特徵;將音頻特徵轉化爲音脣同步的面部動作序列;採用流形映射算法對面部動作序列進行處理,得到多個面部動作的線性組合;根據多個面部動作的線性組合生成面部運動的視頻幀;採用目標人臉渲染器對面部運動的視頻幀進行渲染,生成目標數字人視頻。基於此,本申請實施例能夠生成音脣同步的數字人視頻,具有高保真度,在金融場景下,生成高保真度的數字人視頻可以提升客戶觀感,提高客戶的信賴度,有助於提高金融服務質量,從而提升金融企業的競爭力。

本文源自:金融界

作者:情報員