(審稿中,尚未定稿)
一、關於計畫
「112-114年族語AI翻譯計畫」由財團法人原住民族語言研究發展基金會(原語會)主導,並委託意傳科技股份有限公司執行,第一期計畫為期兩年,自112年11月至114年12月。本計畫是一個探索性的嘗試,旨在審慎運用人工智慧技術,為臺灣原住民族語的數位化應用進行基礎建置,祈為族語傳承工作提供新的方向。
第一期計畫核心工作是為阿美語、賽德克語及太魯閣語三族語建立初步具「可機讀性」語言資料庫。在此基礎上嘗試開發了多項基礎AI應用,包括族語語音辨識、擬真族語語音合成,以及族語基礎翻譯系統。此外,我們也同步為所有 16 族語製作了先導性的族語語音辨識及語音合成功能,作為族語 AI 應用的階段性成果。
透過本計畫的推動,希望能為族語教學、文化傳播及日常溝通提供發展基礎。這些 AI 系統仍處於初步階段,我們將持續驗證與優化其可用性,期待能為族語復振的漫長道路上,帶來更多實踐的可能性。
在此特別感謝台灣聖經公會授權本會使用族語聖經(包含有聲聖經)作為語料,以及Pipalofasaran to Sowal no Pangcah/'Amis 台灣阿美族語言永續發展學會、台灣太魯閣族語言發展學會、台灣原住民族賽德克族語言文化學會、各位族語老師、族語文章作者授權著作。另外感謝執行本計畫之廠商意傳科技有限公司及李鴻欣博士、陳力瑋先生,全心投入 AI 系統開發。
二、語料簡介
本計畫所建置的語言資料庫,包含本基金會既有語料,以及計畫期間所蒐集的語音辨識語料、語音合成語料,和阿美語、賽德克語及太魯閣語三族語的平行語料(族語與華語對譯)。這些語言資料庫及相關的程式碼、模型,皆可對外授權,供後續有合作需求的學術或研究單位參考。這些初步成果可作為基於深度學習的語料庫與AI模型的起點,提供一個可供優化與再開發的基礎,共同為族語 AI 應用做出貢獻。
三、系統簡介
族語語音辨識系統
此族語語音辨識系統(Automatic Speech Recognition, ASR)旨在將族語的口語內容,精準轉換為文字,此系統將現有語語音資料投入機器訓練,處理不同族語的發音特點、語音變異及語速差異。無論是教學錄音、文化訪談或是日常對話,提供語音辨識生成服務。
為收集各族口語語料,本會另延伸製作供各族語推組織及語推人員使用的族語字幕辨識系統,用以大幅降低人工繕打語料逐字稿的作業時間,增加語料收集效率,加速語推組織、語推人員的語料收集。
擬真族語語音合成系統
擬真族語語音合成系統(Text-to-Speech, TTS)是將族語文字內容,轉換成自然流暢的人類語音。本計畫除以現有可蒐集之聲音語料進行合成,另錄製秀姑巒阿美語、太魯閣語、德固達雅賽德克語於專業錄音室之高品質錄音語料各 10 小時,運用語音合成技術發展接近真人發音的族語語音。
這項技術期待可廣泛應用於族語學習教材的製作、有聲書的生成、族語導覽系統,甚至是智慧語音助理,讓族語能以更生動、多元的形式呈現,打破學習與使用的門檻,使族語的傳播與應用更加普及。
族語基礎翻譯系統beta
族語基礎翻譯系統旨在建立族語與台灣華語的雙向翻譯功能(目前支援阿美語、賽德克語及太魯閣語)。本系統透過學習大量的平行語料(族語與台灣華語的對照文本),運用機器翻譯技術,旨在實現文本的快速、初步翻譯。它能夠幫助使用者在不同語言間進行基本的溝通與理解,例如將族語文本翻譯成中文,或將中文翻譯成族語。
本系統翻譯精確度仍需持續優化,但作為一個基礎工具,將促進族語學習者對文本的理解,並為族語內容的跨語言傳播提供便利。這項技術是未來發展更複雜、更精準翻譯服務的起點,對於推動族語在多元文化社會中的交流與應用具有重要意義。