(資料圖)
誰說大模型都是冰冷的代碼?其實,它也可以塑造“血肉之軀”。在8月15日訊飛星火認知大模型V2.0升級發(fā)布會上,我們見識了虛擬主播介紹世外桃源“桃花潭”的美景,也親眼目睹了虛擬外教與劉聰院長“狂飆”口語的炫酷。而這些應(yīng)用場景,都源于星火V2.0在多模態(tài)能力上的提升,讓視頻內(nèi)容生產(chǎn)與英語學(xué)習(xí)效率大幅提升。
中金研報曾指出,如果虛擬角色在大模型等技術(shù)助力下,能夠?qū)崿F(xiàn)與用戶實時智能互動,用戶將獲得更具真實感的體驗,繼而激活一個巨大體量的市場。何況,科大訊飛依托星火多模態(tài)技術(shù),率先將其用于視頻內(nèi)容生產(chǎn)。根據(jù)中國電子信息產(chǎn)業(yè)發(fā)展研究院發(fā)布的數(shù)據(jù),預(yù)計2023年中國超高清視頻產(chǎn)業(yè)規(guī)模將達到4萬億。同時視頻產(chǎn)業(yè)是一條涵蓋生產(chǎn)、分發(fā)、消費等上下游的長鏈條產(chǎn)業(yè),僅生產(chǎn)環(huán)節(jié)的市場規(guī)模就從2016年的19億飆升至2022年的3860.7億元,年均復(fù)合增長率達到222.34%。
基于視頻生產(chǎn)環(huán)節(jié)巨大的商業(yè)機會,訊飛星火認知大模型以多模態(tài)技術(shù)實現(xiàn)“虛擬主播”出鏡,不但極大提升了視頻內(nèi)容質(zhì)感和新穎度,還能化身“景點導(dǎo)游”、”室內(nèi)導(dǎo)覽”以及“銀行客服”等身份,在旅游、展覽、金融等各行各業(yè)發(fā)揮巨大價值。據(jù)悉,科大訊飛虛擬人服務(wù)已在各行各業(yè)遍地開花,并與新華社、央視動畫、中信銀行、中國平安等公司建立了合作,在北京冬奧會、成都大學(xué)生運動會等世界性體育賽事,訊飛虛擬人技術(shù)都進行了精彩呈現(xiàn)。
為了極致簡化使用難度,科大訊飛在星火V2.0發(fā)布會上,重磅升級了訊飛智作2.0一站式AIGC內(nèi)容創(chuàng)作平臺。用戶只要錄制一段真人出鏡的3-10分鐘視頻,再將視頻放到訊飛智作2.0平臺進行訓(xùn)練,即可生成1:1還原的真人虛擬數(shù)字分身。同時也可以選擇不同風(fēng)格的配音,讓虛擬人具有多情感演繹能力,結(jié)合內(nèi)容本身的喜怒哀樂來控制語氣、語調(diào)和停頓,讓用戶看到“有血有肉”的溫情演繹。
關(guān)鍵詞: