“一峰一狀百樹迎,天水合璧兩岸情?!蹦隳芟胂蟪鲞@句詩出自虛擬數(shù)字人(又稱AI數(shù)字人)之口嗎?近日,百度虛擬數(shù)字人家族在2022百度世界大會(huì)上的集體亮相再次引爆輿論場(chǎng)。它們有的能歌善舞,有的妙筆生花,有的已經(jīng)開始探索太空,有的則在輔助智能制造……IDC最新發(fā)布的報(bào)告顯示,中國虛擬數(shù)字人市場(chǎng)規(guī)模呈現(xiàn)高速增長(zhǎng)趨勢(shì),預(yù)計(jì)到2026年將達(dá)到102.4億元。當(dāng)前,政策、應(yīng)用價(jià)值、市場(chǎng)需求、資本支出、技術(shù)成熟正合力推動(dòng)虛擬數(shù)字人市場(chǎng)崛起。作為人工智能技術(shù)最熱門的應(yīng)用之一,業(yè)內(nèi)對(duì)虛擬數(shù)字人的觀點(diǎn)不一,眾說紛紜。但不可否認(rèn)的是,虛擬數(shù)字人正在以不可抵擋的姿態(tài)迎面而來?! ?/span>
互聯(lián)網(wǎng)大廠差異化布局虛擬數(shù)字人
? ? ? ?據(jù)不完全統(tǒng)計(jì),2021年,虛擬數(shù)字人領(lǐng)域投融資事件27起,融資金額在百萬至千萬元之間。尤其是在元宇宙、Web3.0等概念的推動(dòng)下,虛擬數(shù)字人市場(chǎng)迅速升溫,資本不斷涌入。自2022年以來,數(shù)字人領(lǐng)域融資已達(dá)到了近百起,融資金額累計(jì)突破4億元?! ?/span>
互聯(lián)網(wǎng)大廠雖集體入局,但切入點(diǎn)卻各有不同。其中,百度第一個(gè)明確了全場(chǎng)景、大生態(tài)的定位,以虛擬數(shù)字人為載體全方位輸出其在人工智能算法、底層技術(shù)、行業(yè)應(yīng)用及生態(tài)搭建等方面的優(yōu)勢(shì),旨在實(shí)現(xiàn)規(guī)?;a(chǎn)、快速降低成本,從而實(shí)現(xiàn)虛擬數(shù)字人普惠?! ?/span>
在2022百度世界大會(huì)上,希加加、度曉曉等虛擬數(shù)字人成為大會(huì)主角,出現(xiàn)在現(xiàn)場(chǎng)多個(gè)環(huán)節(jié)中。百度飛槳和文心大模型為其虛擬數(shù)字人提供了脫穎而出的深度學(xué)習(xí)和內(nèi)容創(chuàng)造能力。記者從會(huì)上獲悉,百度虛擬數(shù)字人家族數(shù)量已經(jīng)達(dá)到了幾十個(gè),百度智能云曦靈數(shù)字人平臺(tái)將實(shí)現(xiàn)超寫實(shí)數(shù)字人24小時(shí)純AI直播。百度副總裁袁佛玉更是直言:“百度AI算法的突破,讓虛擬數(shù)字人制作成本十倍、百倍地下降,還能讓數(shù)字人的生產(chǎn)周期,從動(dòng)輒幾個(gè)月縮短到小時(shí)級(jí)別。虛擬數(shù)字人的制作成本,將從百萬元級(jí)降低到萬元級(jí)別。”
區(qū)別于百度,騰訊依托自身在語音智能和大文娛生態(tài)方面的優(yōu)勢(shì),力圖將IP作為核心亮點(diǎn)和競(jìng)爭(zhēng)力?;谠菩∥?shù)智人平臺(tái),騰訊推出了一系列IP型虛擬數(shù)字人,目前聲量比較大的有《QQ炫舞》的星瞳、《和平精英》的吉莉、《王者榮耀》的無限王者團(tuán)等。這些由游戲角色升級(jí)而來的虛擬偶像,天生具備廣泛的粉絲基礎(chǔ),商業(yè)價(jià)值高,且能對(duì)其游戲內(nèi)容進(jìn)行反哺?! ?/span>
《QQ炫舞》系列發(fā)行制作人Todd此前表示,國內(nèi)虛擬偶像目前的變現(xiàn)邏輯距離成熟模式還很遠(yuǎn),除了品牌合作,未來還有發(fā)行唱片、制作動(dòng)畫和游戲等一系列途徑。如果眼下進(jìn)行過度的商業(yè)價(jià)值挖掘,會(huì)傷害這些長(zhǎng)遠(yuǎn)的價(jià)值。因此,團(tuán)隊(duì)并不急于變現(xiàn)?! ?/span>
不過,騰訊也不是光靠IP布局虛擬數(shù)字人,還同步推出了一些基于特定場(chǎng)景的虛擬數(shù)字人,如平安普惠數(shù)字員工、新華社主播“新小微”、航天員“小諍”、3D手語翻譯官“聆語”、故宮博物館導(dǎo)游“福大人”等。這些虛擬人多是為企業(yè)端業(yè)務(wù)場(chǎng)景量身定制,或者是與旗下智能車載、智能家居、智能交通等智能設(shè)備結(jié)合,定位是服務(wù)型數(shù)字助手?! ?/span>
阿里巴巴對(duì)于虛擬數(shù)字人的態(tài)度則更為保守,主要為自身業(yè)務(wù)需求服務(wù)。借著北京冬奧會(huì)的契機(jī)大火了一把的數(shù)字人“冬冬”采用了面向高質(zhì)量圖形的Unity高清渲染管線(HDRP),在視覺上有著不輸AR/VR的效果。但在應(yīng)用場(chǎng)景方面,仍是以直播帶貨為主,契合其老本行——電商業(yè)務(wù)的需求。
阿里巴巴研究員、數(shù)字人技術(shù)負(fù)責(zé)人李小龍表示:“虛擬數(shù)字人需要在特定場(chǎng)景內(nèi)真正解決人的問題?!彪娚讨辈ラg是一個(gè)已經(jīng)被驗(yàn)證可行的商業(yè)化場(chǎng)景。阿里巴巴已經(jīng)在淘寶直播的場(chǎng)景中進(jìn)行虛擬數(shù)字人應(yīng)用落地嘗試,“當(dāng)前階段,已經(jīng)有600多家商家在嘗試我們的虛擬主播,每天開播的超過200家”?! ?/span>
從產(chǎn)業(yè)鏈全局來看,不止是BAT,華為云、京東云、字節(jié)跳動(dòng)、科大訊飛、商湯科技、小冰公司等科技廠商皆已參與到虛擬數(shù)字人生產(chǎn)中來。基礎(chǔ)軟硬件方面,不僅有英偉達(dá)、英特爾、AMD等芯片大廠,還有百度、阿里、華為、浪潮、聯(lián)想等廠商在提供算力服務(wù)。在建模、動(dòng)作捕捉及渲染方面,也不乏Adobe、AutoDesk、Unity、Unreal等知名廠商的身影。應(yīng)用層更是覆蓋了影視、傳媒、游戲、文旅、零售等諸多領(lǐng)域,數(shù)字王國、諾華視創(chuàng)、嗶哩嗶哩、浦發(fā)銀行、中國移動(dòng)等皆在其中。某AI公司專家指出:“虛擬數(shù)字人的產(chǎn)業(yè)鏈較長(zhǎng)且覆蓋面廣泛,多數(shù)入局企業(yè)正在基于自身技術(shù)優(yōu)勢(shì)以及客戶群體覆蓋的領(lǐng)域進(jìn)行研發(fā)創(chuàng)新,以構(gòu)建差異化競(jìng)爭(zhēng)優(yōu)勢(shì)?!薄 ?/span>
虛擬數(shù)字人產(chǎn)業(yè)基礎(chǔ)尚待夯實(shí)
? ? ? ?“由于行業(yè)內(nèi)產(chǎn)業(yè)鏈各環(huán)節(jié)公司專注于虛擬數(shù)字人生產(chǎn)流程中的單點(diǎn)環(huán)節(jié),各類企業(yè)相對(duì)割裂,尚未實(shí)現(xiàn)協(xié)同調(diào)優(yōu),加之目前數(shù)字人生產(chǎn)、運(yùn)營成本較高,市場(chǎng)接受度尚低,整個(gè)產(chǎn)業(yè)發(fā)展尚處于起步階段。”賽迪顧問人工智能產(chǎn)業(yè)研究中心高級(jí)分析師于凱迪在接受《中國電子報(bào)》記者采訪時(shí)說道。
目前,虛擬數(shù)字人的生產(chǎn)商以互聯(lián)網(wǎng)公司為主,雖然許多公司都推出了自己的虛擬數(shù)字人,但它們各自的AI算法大多是自閉環(huán)的,只需要購買一些基礎(chǔ)的軟硬件即可。而產(chǎn)業(yè)鏈上那些純靠賣算法的AI公司則只能將目標(biāo)客戶定位于那些非互聯(lián)網(wǎng)公司企業(yè)身上。二者之間未能找到一種互惠互利的良性生態(tài)模式?! ?/span>
人類可以敏銳地通過口唇、表情、肢體行為來讀取非文本信息,因此對(duì)于虛擬數(shù)字人交互過程中呈現(xiàn)的效果有很高的要求,這就需要NLP、智能語音、知識(shí)圖譜等AI技術(shù)訓(xùn)練具備極高的協(xié)同能力,這種技術(shù)融合的難度較高。整體來看,數(shù)字人還處于前期探索階段,生產(chǎn)、運(yùn)營成本較高,普遍面向B端客戶,針對(duì)C端市場(chǎng)的需求,如普通用戶生成自己的虛擬形象、AI化身等,還有待挖掘和激活?! ?/span>
在虛擬人生產(chǎn)技術(shù)方面,同樣存在許多薄弱環(huán)節(jié)。如登上春晚的虛擬數(shù)字人翎Ling就被吐槽面部僵硬一眼假;北京國際電影節(jié)的元宇宙星推官虛擬數(shù)字人“梅澀甜”也被吐槽角色建模塑膠感嚴(yán)重,“土味十足”;首個(gè)國風(fēng)虛擬男藝人秦佑同樣被吐槽“毫無特色”?! ?/span>
浙江大學(xué)國際聯(lián)合商學(xué)院數(shù)字經(jīng)濟(jì)與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤和林坦言,國內(nèi)3D素材、生產(chǎn)3D形象動(dòng)作的游戲引擎等工具軟件比較落后,生產(chǎn)虛擬數(shù)字人的工具軟件基本被國外公司壟斷,需要從基礎(chǔ)引擎、建模軟件、AI學(xué)習(xí)框架、編程語言方面有很多創(chuàng)新,來夯實(shí)虛擬數(shù)字人產(chǎn)業(yè)基礎(chǔ)?! ?/span>
北京虛擬動(dòng)點(diǎn)科技有限公司技術(shù)總監(jiān)崔超在接受《中國電子報(bào)》記者采訪時(shí)表示:“數(shù)字人生產(chǎn)技術(shù)目前的薄弱環(huán)節(jié)主要體現(xiàn)在骨骼重定向、真實(shí)度模擬、聲音處理等方面,例如骨骼重定向時(shí)真實(shí)人和數(shù)字人的骨骼比例相差較大,骨骼拓?fù)浣Y(jié)構(gòu)不同時(shí),可起到很好的驅(qū)動(dòng)作用,得到更真實(shí)的匹配效果,但這項(xiàng)技術(shù)難度較高。再比如數(shù)字人要達(dá)到與真人無異的還原度,聲音處理也是一大難點(diǎn),AI驅(qū)動(dòng)的聲音大都缺乏感情,有損數(shù)字人的真實(shí)度。多數(shù)生產(chǎn)商在軟件、算法端的技術(shù)能力依然有很大提升空間?!薄 ?/span>
“數(shù)智人不僅要聽得到、聽得清人類的語言,還需要能聽得懂、說得出,復(fù)雜應(yīng)用場(chǎng)景對(duì)技術(shù)提出了更高要求?!彬v訊數(shù)智人業(yè)務(wù)相關(guān)負(fù)責(zé)人對(duì)《中國電子報(bào)》記者說道:“制作方式自動(dòng)化水平較低、關(guān)鍵技術(shù)有待發(fā)展,以及技術(shù)人才、綜合人才的缺乏,也在一定程度上限制了數(shù)智人的產(chǎn)業(yè)化發(fā)展。”
盡管一代又一代虛擬數(shù)字人蜂擁而至,但它們中的多數(shù)并未在市場(chǎng)中激起太大浪花就已消失不見了。究其原因,依然與成本問題有很大干系。雖然百度聲稱基于算法突破可將數(shù)字人的制作成本從百萬元級(jí)降低到萬元級(jí)別。百度集團(tuán)資深副總裁、百度移動(dòng)生態(tài)事業(yè)群組(MEG)總經(jīng)理何俊杰表示:“‘人均一個(gè)數(shù)字人’的時(shí)代已經(jīng)到來?!薄 ?/span>
但實(shí)際上,虛擬數(shù)字人的“支撐成本”遠(yuǎn)比前期生產(chǎn)制作還要“燒錢”。公開數(shù)據(jù)顯示,設(shè)計(jì)一個(gè)虛擬偶像形象花費(fèi)10萬元至100萬元,而后續(xù)的內(nèi)容制作和智能驅(qū)動(dòng)則需一年200萬元到500萬元的持續(xù)性投入,這還不算營銷端、運(yùn)營端等其他投入?! ?/span>
“柳夜熙”團(tuán)隊(duì)曾透露,推出“柳夜熙”之前的半年多時(shí)間,研發(fā)成本、人員成本、技術(shù)成本等投入已“遠(yuǎn)超百萬元”,它的第一條短視頻成本就差不多花了幾十萬元。小冰公司首席運(yùn)營官、人工智能創(chuàng)造力實(shí)驗(yàn)室負(fù)責(zé)人徐元春也曾表示,目前運(yùn)用3D建模等類似技術(shù)制作的超寫實(shí)虛擬人,僅單個(gè)形象部分,3D模型成本就在30萬元至45萬元左右,運(yùn)營一年可能要花掉五六百萬元。
在花團(tuán)錦簇的表象之下,不得不承認(rèn)的是我們距離“人均一個(gè)虛擬數(shù)字人”還有很長(zhǎng)的一段路要走。于凱迪說:“虛擬數(shù)字人是否達(dá)到批量化生產(chǎn)的標(biāo)準(zhǔn)受虛擬數(shù)字人系統(tǒng)平臺(tái)的工程化能力,也就是系統(tǒng)的易用性、可拓展性、兼容性、可靠性等能力的影響。待虛擬數(shù)字人系統(tǒng)平臺(tái)的制作效率和技術(shù)能力實(shí)現(xiàn)大幅提升,‘人均一個(gè)數(shù)字人’才有實(shí)現(xiàn)的可能?!薄 ?/span>
下一代虛擬數(shù)字人還有多遠(yuǎn)?
IDC報(bào)告認(rèn)為,當(dāng)前數(shù)字人大多處于L1~L3階段,即依賴算法驅(qū)動(dòng)肢體、姿態(tài)、口型、表情等,數(shù)字人可執(zhí)行簡(jiǎn)單的決策和操作。未來數(shù)字人將實(shí)現(xiàn)L4~L5水平,由數(shù)字人自主進(jìn)行決策、執(zhí)行任務(wù),完全實(shí)現(xiàn)智能化交互?! ?/span>
隨著新興業(yè)態(tài)興起,直播購物、在線教育、線上旅游、遠(yuǎn)程問診等生產(chǎn)生活新方式加速推廣;伴隨超高清電視的普及應(yīng)用,互動(dòng)視頻、沉浸式視頻、VR/AR游戲等新業(yè)態(tài)正不斷拓展社交、購物、娛樂、展覽、旅游、教育、醫(yī)療等領(lǐng)域的邊界,人機(jī)智能交互將成為人工智能典型應(yīng)用模式,為虛擬數(shù)字人在上述行業(yè)的大規(guī)模落地提供良好的基礎(chǔ)?! ?/span>
“基于新一代多模態(tài)人機(jī)交互系統(tǒng)的業(yè)務(wù)型、功能型數(shù)智人,通過整合語音交互、知識(shí)圖譜、視覺識(shí)別和情緒識(shí)別等技術(shù),有效連接內(nèi)容和服務(wù)、B端和C端,在垂直產(chǎn)業(yè)鏈條中提供智能化服務(wù),以適應(yīng)更多元的行業(yè)化、業(yè)務(wù)化、場(chǎng)景化需求。這將大大拓展數(shù)字人的應(yīng)用場(chǎng)景,并助推這一新興領(lǐng)域的價(jià)值躍遷?!彬v訊數(shù)智人業(yè)務(wù)相關(guān)負(fù)責(zé)人說道?! ?/span>
在技術(shù)方向上,文本數(shù)據(jù)和語音、圖像數(shù)據(jù)的多模態(tài)融合依然是未來虛擬數(shù)字人產(chǎn)品的剛需;在應(yīng)用方向上,國內(nèi)的優(yōu)勢(shì)在于豐富的落地應(yīng)用場(chǎng)景,虛擬數(shù)字人應(yīng)用將優(yōu)先面向金融、政府、傳媒、電商、影視特效等行業(yè)的ToB專業(yè)服務(wù)場(chǎng)景,如虛擬帶貨主播、媒體行業(yè)虛擬主播、金融及政務(wù)行業(yè)問答機(jī)器人、電影特效數(shù)字人等;此外,國內(nèi)互聯(lián)網(wǎng)直播、在線教育、在線文旅、在線醫(yī)療、電競(jìng)、社交等行業(yè)對(duì)于具有更加鮮活形象的虛擬數(shù)字人也存在廣泛的潛在需求,ToC的虛擬數(shù)字人產(chǎn)品研發(fā)也是未來的方向之一?! ?/span>
另有觀點(diǎn)認(rèn)為,下一代虛擬數(shù)字人的進(jìn)化方向與元宇宙的演進(jìn)方向息息相關(guān)。它將成為人們從現(xiàn)實(shí)生活走入元宇宙的“數(shù)字化身”,擁有自己的身份、資產(chǎn),甚至是價(jià)值觀等,不但可以為元宇宙帶來豐富的內(nèi)容,還能給參與者提供一種更深層次的沉浸式體驗(yàn)?! ?/span>
正如Forrester分析師盧冠男此前接受記者采訪時(shí)所言,當(dāng)前我們剛剛進(jìn)入“元宇宙先兆”時(shí)期,后續(xù)還將進(jìn)入初始型元宇宙(primordial metaverse),即不同虛擬世界的聯(lián)結(jié)機(jī)制使用戶可以從一個(gè)虛擬空間去往另一個(gè)空間,就像在不同網(wǎng)站瀏覽網(wǎng)頁,以及聯(lián)邦式元宇宙(federated metaverse),即不同的虛擬世界采納一套共同系統(tǒng),支持并遵循身份和資產(chǎn)的可移植性和一致性。未來,我們也有可能以虛擬數(shù)字人的形態(tài)穿梭于元宇宙之中,讓科幻電影中的場(chǎng)景變?yōu)楝F(xiàn)實(shí)。
IDC中國助理研究總監(jiān)盧言霞表示,今天的虛擬數(shù)字人在某些領(lǐng)域發(fā)揮了明顯的商業(yè)價(jià)值。未來,在生活和工作中,將有大量的數(shù)字人團(tuán)隊(duì)與人類共存。一方面,行業(yè)用戶可以從相對(duì)成熟的應(yīng)用場(chǎng)景中引入虛擬數(shù)字人;另一方面,要對(duì)這些應(yīng)用場(chǎng)景保持耐心,不要設(shè)置過高的期望值。
來源:中國電子報(bào)