您的位置:首頁 >綜合 > 財經(jīng)要聞 >

垂直領(lǐng)域大模型涌現(xiàn),新壹科技瞄準(zhǔn)視頻領(lǐng)域


(資料圖片僅供參考)

7月27日,新壹科技發(fā)布首款聚焦視頻的大模型“新壹視頻大模型”,以及AIGC視頻生成平臺“秒創(chuàng)視頻創(chuàng)作平臺”,首款基于商用的數(shù)字人平臺“新壹數(shù)字人平臺”,此外,還發(fā)布了首款明星數(shù)字人祝福視頻制作產(chǎn)品“秒?!薄?/p>

新壹科技表示,目前其AI生成能力已覆蓋文本、圖像、音視頻等內(nèi)容模態(tài),實(shí)現(xiàn)了從大模型到平臺服務(wù)再到產(chǎn)品服務(wù)落地的AIGC業(yè)務(wù)全鏈路打通。

新壹科技創(chuàng)始人、董事長韓坤表示,由于沒有從實(shí)際場景出發(fā),導(dǎo)致大部分通用大模型的實(shí)用性并不強(qiáng),難以真正重塑實(shí)際的生產(chǎn)?!拔覀冃枰⒁粋€連接AI技術(shù)能力和垂直場景需求的大模型,能夠提供釋放生產(chǎn)力的能力,并創(chuàng)造更多實(shí)際價值的垂直場景大模型?!?/p>

據(jù)介紹,新壹視頻大模型是以視頻生成為核心的多模態(tài)AIGC模型?;谏疃葘W(xué)習(xí)海量視頻樣本,新壹視頻大模型擁有了從腳本生成、素材匹配、智能剪輯配音到數(shù)字人播報的AI全流程視頻生產(chǎn)能力。

據(jù)介紹,新壹視頻大模型具備多模態(tài)感知、實(shí)時學(xué)習(xí)、自迭代及多場景交叉推理的核心能力。能夠處理多模態(tài)的輸入信息,可以理解文字的含義,識別圖像的內(nèi)容,感知音樂的情緒,基于對內(nèi)容深度準(zhǔn)確的理解,生成視頻。

新壹視頻大模型采用了自監(jiān)督學(xué)習(xí)方案,會觀察和學(xué)習(xí)大量的視頻數(shù)據(jù),通過分析視頻的結(jié)構(gòu)、內(nèi)容、風(fēng)格等多個維度,自我理解和把握視頻制作的規(guī)則和邏輯。

同時,新壹科技還現(xiàn)場演示了秒創(chuàng)視頻創(chuàng)作平臺的操作全過程。秒創(chuàng)是基于新壹科技視頻大模型的智能AI內(nèi)容生成平臺。通過秒創(chuàng)平臺,創(chuàng)作者可以把一篇文章甚至是一個想法制作為視頻,5分鐘即可從文案到視頻成品。為了達(dá)到這樣的效果,秒創(chuàng)除了提供圖片生成、視頻生成、聲音生成、數(shù)字人生成等AIGC功能外,還提供了一個千萬級的結(jié)構(gòu)化視頻庫位用戶提供匹配。據(jù)悉,秒創(chuàng)試運(yùn)營半年多以來,已經(jīng)積累了200多萬的用戶,每天產(chǎn)出超過10萬分鐘視頻。

新壹科技還發(fā)布了數(shù)字人平臺。通過多模態(tài)合成AI技術(shù),該平臺可以將真人錄制的視頻和音頻素材,生成2D寫實(shí)數(shù)字人。基于新壹視頻大模型, 24小時內(nèi)可完成一個數(shù)字人的訓(xùn)練。新壹數(shù)字人平臺也可以驅(qū)動各種風(fēng)格的3D數(shù)字人形象。新壹科技預(yù)計(jì)今年中國將至少新增100萬個數(shù)字人。

秒祝通過對明星視頻進(jìn)行訓(xùn)練,將明星的形象和聲音還原出來,生成對應(yīng)的明星數(shù)字人形象。最終呈現(xiàn)給客戶的是以明星數(shù)字人為主角的個性化定制祝福視頻。

韓坤表示,在過去將近20年的時間里,新壹科技都在深耕視頻行業(yè),接下來,將推出更多的垂直場景服務(wù)平臺和產(chǎn)品,比如為政府政務(wù)、金融保險、適老養(yǎng)老、智能交互數(shù)字人以及游戲等垂直場景提供服務(wù),目前已經(jīng)有解決方案和產(chǎn)品正在落地。

關(guān)鍵詞:
最新動態(tài)
相關(guān)文章
垂直領(lǐng)域大模型涌現(xiàn),新壹科技瞄準(zhǔn)視頻領(lǐng)域
尹力:北京市將堅(jiān)定不移落實(shí)“兩個毫不...
A股午后震蕩回落,港股走勢強(qiáng)勁,邁入技...
午后下跌,原因找到了!抖音直播間停業(yè)...
橫盤4個月?lián)Q今天20cm漲停,你愿意等嗎?
全球超過7.8億人遭受饑餓,全球糧食體系...