這個針對本地人口音、對話習慣以及詞彙用語的語音識別系統,掌握了“語碼轉換”技術,可同時識別兩種語言,這是目前市場上的系統未能做到的。
我國人工智能研究機構在語音識別技術上取得突破,成功研發支持“語碼轉換”的識別系統,可同時識別兩種以上的語言,准確率超過90%。
目前市場上的語音識別軟件多由歐美研發,只針對單一語言進行識別。用戶必須在使用之前選擇所要識別和轉錄的語言,系統才能准確地將語言轉換成文字。因此,對于習慣在日常用語中摻雜華英甚至馬來語、福建話等多種語言和方言的新加坡人而言,系統的完整和准確性都有待改善。
新加坡全國人工智能核心(AI Singapore)接獲多家機構反饋後,決定與新加坡國立大學和南洋理工大學研究人員合作,研發以新加坡人爲主要服務對象,針對本地人口音、對話習慣及詞彙用語的語音識別系統,並爲此專門撥款125萬元設立研究中心。
國大電機與電腦工程教授李海洲表示,最大的技術突破在于系統掌握了“語碼轉換”(code switch)技術,可同時識別兩種語言。換言之,系統能准確判斷一句話當中哪個音節是英語、哪個音節代表的是華文詞彙,拼湊出完整的語句並理解其含義。這是目前市場上的系統未能做到的。
研究團隊在本地采集了幾千人的口語樣本,再輸入人工智能深層學習系統,分析本地人在什麽語境下會轉換語碼。他說:“通常當使用者想不出替換詞彙,或是詞彙在另一語言中的表達更爲簡潔的時候,就會自然而然轉換。比如‘打電話’用華文表達是三個音節,英語‘call’則只需要一個音節。”
研究中心首個項目將爲民防設計轉錄軟件
准確的語音識別功能可加快記錄資料的效率,也可用于操控家電、手機軟件等,有許多應用方式。目前已有超過五家機構正在考慮使用這項技術。由于政府部門不能使用第三方識別軟件,因此全國人工智能核心也有計劃將這項技術推廣至所有政府部門。
研究中心的首個項目將會是爲民防部隊設計轉錄軟件。民防部隊熱線每年接聽20萬通熱線電話,若能通過系統自動轉錄電話內容,將會爲工作人員省下不少記錄檔案的時間。
這套語音識別系統內有超過8萬個中英詞彙,簡單的方言和馬來語名詞如部分菜名和地名也已輸入系統,其他語言和方言詞彙量則會陸續增加。