(資料圖)
為了讓眾多以地方方言為載體的區(qū)域歷史、文化和習俗可以以短視頻的形式制作、傳播與保存,解決地方方言難以被更多用戶閱讀和理解的障礙。近期,抖音正式上線了地方方言自動翻譯功能。創(chuàng)作者可以使用該功能,“一鍵”將粵語、閩語、吳語、西南官話、中原官話等方言視頻轉(zhuǎn)化出普通話字幕,方便公眾觀看。
隨著短視頻的不斷普及,越來越多以地方方言為載體的視頻出現(xiàn)在了短視頻平臺。這些極具地方特色的視頻,一方面讓廣大用戶欣賞到了山南海北不同區(qū)域的口音與特色腔調(diào);另一方面,也因為方言識別的天然障礙,使其難以更好得被深度了解和傳播。
為此,抖音近期正式上線了地方方言自動翻譯功能。創(chuàng)作者可在抖音投稿主界面點擊“拍攝上傳投稿”,上傳視頻后,使用“自動字幕”功能,選擇“轉(zhuǎn)為普通話字幕”,新功能即可完成對視頻內(nèi)容的方言語音自動識別,并將視頻里的方言內(nèi)容轉(zhuǎn)化成普通話字幕。目前,新功能第一期已經(jīng)上線,支持粵語、閩語、吳語(上海)、西南官話(四川)、中原官話(陜西、河南)等,未來還將支持更多方言轉(zhuǎn)化。
據(jù)悉,由于各地方言常以口語形式流傳,可用于模型訓練的方言語料數(shù)據(jù)較少,對方言識別和翻譯都提出了很大挑戰(zhàn)。對此,來自火山引擎的技術(shù)團隊采用了自研的自監(jiān)督預(yù)訓練模型和多語言翻譯模型,實現(xiàn)了極少量標注數(shù)據(jù)條件下識別方言的能力,且訓練效率提升一倍,有效有效提升了多語言翻譯的性能,同時大幅降低了模型訓練的資源消耗。“基于日常服務(wù)抖音集團業(yè)務(wù)的技術(shù)積累,抖音方言字幕可實現(xiàn)超低延時和高準確率”,其團隊負責人表示。
關(guān)鍵詞: