(資料圖)
為了讓眾多以地方方言為載體的區(qū)域歷史、文化和習(xí)俗可以以短視頻的形式制作、傳播與保存,解決地方方言難以被更多用戶閱讀和理解的障礙。近期,抖音正式上線了地方方言自動(dòng)翻譯功能。創(chuàng)作者可以使用該功能,“一鍵”將粵語(yǔ)、閩語(yǔ)、吳語(yǔ)、西南官話、中原官話等方言視頻轉(zhuǎn)化出普通話字幕,方便公眾觀看。
隨著短視頻的不斷普及,越來(lái)越多以地方方言為載體的視頻出現(xiàn)在了短視頻平臺(tái)。這些極具地方特色的視頻,一方面讓廣大用戶欣賞到了山南海北不同區(qū)域的口音與特色腔調(diào);另一方面,也因?yàn)榉窖宰R(shí)別的天然障礙,使其難以更好得被深度了解和傳播。
為此,抖音近期正式上線了地方方言自動(dòng)翻譯功能。創(chuàng)作者可在抖音投稿主界面點(diǎn)擊“拍攝上傳投稿”,上傳視頻后,使用“自動(dòng)字幕”功能,選擇“轉(zhuǎn)為普通話字幕”,新功能即可完成對(duì)視頻內(nèi)容的方言語(yǔ)音自動(dòng)識(shí)別,并將視頻里的方言內(nèi)容轉(zhuǎn)化成普通話字幕。目前,新功能第一期已經(jīng)上線,支持粵語(yǔ)、閩語(yǔ)、吳語(yǔ)(上海)、西南官話(四川)、中原官話(陜西、河南)等,未來(lái)還將支持更多方言轉(zhuǎn)化。
據(jù)悉,由于各地方言常以口語(yǔ)形式流傳,可用于模型訓(xùn)練的方言語(yǔ)料數(shù)據(jù)較少,對(duì)方言識(shí)別和翻譯都提出了很大挑戰(zhàn)。對(duì)此,來(lái)自火山引擎的技術(shù)團(tuán)隊(duì)采用了自研的自監(jiān)督預(yù)訓(xùn)練模型和多語(yǔ)言翻譯模型,實(shí)現(xiàn)了極少量標(biāo)注數(shù)據(jù)條件下識(shí)別方言的能力,且訓(xùn)練效率提升一倍,有效有效提升了多語(yǔ)言翻譯的性能,同時(shí)大幅降低了模型訓(xùn)練的資源消耗?!盎谌粘7?wù)抖音集團(tuán)業(yè)務(wù)的技術(shù)積累,抖音方言字幕可實(shí)現(xiàn)超低延時(shí)和高準(zhǔn)確率”,其團(tuán)隊(duì)負(fù)責(zé)人表示。
關(guān)鍵詞: