得益于大模型、多模態(tài)和數(shù)字孿生等技術(shù)的進(jìn)步,AIGC被提到前所未有的關(guān)注度。AI數(shù)字人作為AIGC對(duì)外輸出的渠道,也是各大廠商重點(diǎn)發(fā)展的方向。
(資料圖片僅供參考)
在AIGC的推動(dòng)下,AI數(shù)字人逐漸升級(jí),相較于過(guò)去,過(guò)去AI數(shù)字人僅僅將2D圖片轉(zhuǎn)換為3D數(shù)字人,用于帶貨、直播等偏娛樂(lè)的場(chǎng)景,現(xiàn)在AI數(shù)字人的制作成本降低,其內(nèi)容創(chuàng)作能力生成內(nèi)容生產(chǎn)工具等,可進(jìn)一步促進(jìn)企業(yè)降本增效。
風(fēng)平智能便是AI數(shù)字人領(lǐng)域的早期布局者,據(jù)介紹,旗下風(fēng)平IP智造平臺(tái)是基于AIGC打造的智能化平臺(tái),提供虛擬數(shù)字人定制、AI短視頻內(nèi)容生產(chǎn)和數(shù)字人直播、IP培育和交易等一站式解決方案。
近日,風(fēng)平智能創(chuàng)始人&CEO林洪祥接受了藍(lán)鯨TMT記者專訪,對(duì)AIGC行業(yè)的變遷、行業(yè)技術(shù)發(fā)展、以及安全性問(wèn)題等提出了自己的看法和思考。
從無(wú)人問(wèn)津到門庭若市,做企業(yè)的“1號(hào)員工”
林洪祥見(jiàn)證了整個(gè)AIGC賽道的發(fā)展,也眼見(jiàn)AI數(shù)字人領(lǐng)域從無(wú)人問(wèn)津到門庭若市。
“去年,整個(gè)行業(yè)都還是特別冷門的,今年以來(lái)發(fā)展速度連技術(shù)同行都覺(jué)得不可思議,尤其是ChatGPT加上數(shù)字人,再加上直播,三大行業(yè)結(jié)合,讓我們一下子就看到了新的機(jī)會(huì)點(diǎn)?!?/p>
林洪祥認(rèn)為,AIGC是一個(gè)媲美移動(dòng)互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施革命,“20年前,每個(gè)公司都在做自己網(wǎng)站,10年前都在做企業(yè)的App,之后就是做小程序、微信公眾號(hào),AI數(shù)字人會(huì)是未來(lái)AI世界的基礎(chǔ)交互單元,數(shù)字人可以承載很好的信息溝通與傳遞的功能,我們想為每個(gè)企業(yè)打造除公司CEO之外最懂企業(yè)的‘1號(hào)員工’,成為公司的新‘網(wǎng)站’。 ”
AI數(shù)字人的生成形式目前有兩種,一種是克隆人,另一種是AI創(chuàng)作??寺∪耸菍F(xiàn)實(shí)中的人1:1復(fù)刻出來(lái),而AI創(chuàng)作的數(shù)字人則是在現(xiàn)實(shí)生活中不存在的,屬于獨(dú)一無(wú)二的IP。
林洪祥介紹稱,目前,AI數(shù)字人的應(yīng)用場(chǎng)景已經(jīng)比較豐富,除了主播,還可以做視頻的批量化生產(chǎn),也可以幫助企業(yè)降本增效,在教師、醫(yī)生、律師、明星等行業(yè)通過(guò)數(shù)字人去訓(xùn)練智能大腦,可以讓這些人去獲得一個(gè)分身。
IDC數(shù)據(jù)顯示,數(shù)字人應(yīng)用范疇包括泛娛樂(lè)數(shù)字人以及企業(yè)及服務(wù)數(shù)字人,預(yù)測(cè)2026年中國(guó)AI數(shù)字人市場(chǎng)規(guī)模將達(dá)到102.4億元。
4月份第三方測(cè)評(píng)數(shù)據(jù)顯示,風(fēng)平智能供應(yīng)了市場(chǎng)上80%頭部的數(shù)字人直播品牌,高峰時(shí)期,由其服務(wù)的AI數(shù)字人,單日直播GMV超億元。
近期,樂(lè)華娛樂(lè)CEO杜華推出了她的雙生數(shù)字人華華子,專門替自己直播賣貨。在沒(méi)有任何宣發(fā)下,僅直播10分鐘直播間內(nèi)人數(shù)就到達(dá)了30萬(wàn)。從直播間可以看到,華華子較為真實(shí)的還原了杜華的形象和表現(xiàn)力,#杜華AI華華子直播#也隨即登上了微博熱搜。而華華子正是風(fēng)平智能為杜華打造出來(lái)的克隆人。
“大模型+小樣本”技術(shù)實(shí)現(xiàn)降本增效
隨著AI數(shù)字人的發(fā)展,不僅是應(yīng)用場(chǎng)景更加豐富,IDC認(rèn)為,現(xiàn)在的數(shù)字人在預(yù)訓(xùn)練大模型的推動(dòng)下,不但能夠?qū)⒅谱鞒杀窘档?,在更短的時(shí)間內(nèi)賦予數(shù)字人獨(dú)特的外貌、性格、特長(zhǎng),還能夠?qū)⑵湓趯兕I(lǐng)域進(jìn)行內(nèi)容創(chuàng)作的能力,作為內(nèi)容生產(chǎn)工具幫助企業(yè)降本增效。
對(duì)此,林洪祥解釋稱,在沒(méi)有“大模型+小樣本”技術(shù)之前,原來(lái)AI數(shù)字人,尤其是外形制造領(lǐng)域,首先要對(duì)一個(gè)人進(jìn)行深度的采集,深度采集這個(gè)人的模型需要幾十個(gè)小時(shí)。
“采集一天,有效時(shí)間可能只有兩三個(gè)小時(shí),所以經(jīng)常需要采集十幾天才能完成深度建模,成本是很高的,大概在十幾萬(wàn)到二十萬(wàn)之間?!绷趾橄榉Q。
“大模型+小樣本”技術(shù)產(chǎn)生之后,成本下滑就非常明顯了?!氨热?,一名CEO只需要5分鐘的時(shí)間拍攝一個(gè)視頻,結(jié)合大模型技術(shù)就可以克隆一個(gè)一模一樣的數(shù)字分身,這樣一來(lái),其后續(xù)去做視頻的生產(chǎn)成本就很低了?!绷趾橄楸硎?。
據(jù)介紹,與市場(chǎng)主流方案相比,風(fēng)平智能的風(fēng)平IP智造平臺(tái)能讓AI數(shù)字人的成本降低90%、效率提升500%。
“大模型+小樣本”技術(shù)將這個(gè)行業(yè)的成本降至數(shù)千元級(jí)別,“這樣的級(jí)別就克服了原來(lái)的商用化困難,進(jìn)而推動(dòng)了更多領(lǐng)域可商用?!?/p>
林洪祥認(rèn)為,這在效率上表現(xiàn)得更加明顯。“例如在直播或者視頻錄制中,很多人不擅長(zhǎng)鏡頭語(yǔ)言表達(dá),很難一次性流暢地通過(guò)整個(gè)拍攝。但數(shù)字人甚至比真人的表現(xiàn)力更好,表達(dá)流暢,不會(huì)出現(xiàn)忘詞、發(fā)音不準(zhǔn)或者精神疲憊的狀態(tài)。這個(gè)數(shù)字人可以在相關(guān)員工的組織下,無(wú)縫批量化高效率生產(chǎn)視頻,這在效率上是一個(gè)極大的提升。此外,類似CEO、明星等這類人群,可能平時(shí)工作會(huì)非常忙,數(shù)字人也可以將他們從重復(fù)工作中解脫出來(lái)。”
當(dāng)然,林洪祥也坦承,AI數(shù)字人是有一定缺點(diǎn)的,并不能完全替代人類,“比如在直播間,需要更換衣服時(shí),AI數(shù)字人不能完成,這一場(chǎng)景的實(shí)現(xiàn)成本還是比較高的,因?yàn)橐路慕R獙?shí)現(xiàn)物理質(zhì)感,比如垂墜感等,這在建模中的成本非常高?!?/p>
人類或與AI共同構(gòu)成未來(lái)新世界,安全問(wèn)題成行業(yè)重要考量
以直播為例,采用數(shù)字人進(jìn)行直播,平臺(tái)目前對(duì)于兩種直播模式的政策沒(méi)有區(qū)別,與真人直播的審核情況相同。數(shù)字人主播的行為與直播話術(shù)都是由程序控制的,在敏感詞、違禁詞方面訓(xùn)練得好,出現(xiàn)違規(guī)或封禁的概率會(huì)大大降低。
盡管AI數(shù)字人給我們的生活帶來(lái)了諸多便利,但同時(shí)也存在著風(fēng)險(xiǎn),尤為突出的是個(gè)人隱私泄露和侵權(quán)等問(wèn)題。
林洪祥表示,AIGC是一把雙刃劍,用到好的地方能產(chǎn)生巨大的價(jià)值,用在壞的地方可能會(huì)成為壞人的幫兇,他認(rèn)為人類的未來(lái),跟 AI之間會(huì)有一場(chǎng)生死之戰(zhàn)。
據(jù)林洪祥介紹,風(fēng)平智能公司的名字,來(lái)自風(fēng)平浪靜,英文名字叫full peace。“我們的使命是希望平息這場(chǎng)戰(zhàn)爭(zhēng),讓一切變得風(fēng)平浪靜,讓人類能進(jìn)入一個(gè)風(fēng)平浪靜的AI幸福世界?!?/p>
他認(rèn)為,很可能是人類跟AI一起來(lái)構(gòu)成新的未來(lái)世界,AI應(yīng)該納入國(guó)家級(jí)別,甚至是世界級(jí)別的強(qiáng)監(jiān)管體系。
據(jù)悉,風(fēng)平智能采用了專利技術(shù)的5AS風(fēng)險(xiǎn)管理系統(tǒng)。該系統(tǒng)涵蓋了算法分析、安全篩選、授權(quán)審核、內(nèi)容修正和信息追蹤等環(huán)節(jié),通過(guò)這一綜合的管理流程,能夠及時(shí)識(shí)別潛在的侵權(quán)風(fēng)險(xiǎn),包括對(duì)生成的數(shù)字人進(jìn)行授權(quán)審核,確保僅在獲得本人或相關(guān)權(quán)利方的明確授權(quán)下使用。
林洪祥認(rèn)為AI數(shù)字人只有實(shí)現(xiàn)高質(zhì)量、安全可控發(fā)展,才能造福全人類?!案哔|(zhì)量是為了勝任不同的工作場(chǎng)景,安全可控是為了使這個(gè)技術(shù)有益于人類的發(fā)展。我們想讓AI數(shù)字人擁有漂亮的外表和有趣的靈魂?!?/p>