提起Search Engine服務,不少人都想起Google。於網頁輸入搜尋關鍵字時,除了英文外,香港用家往往會用到手寫、倉頡等中文輸入法,對於不諳輸入法或使用流動裝置的用家來說,操作起來稍有不便。有見及此,Google早年就專為香港用家推出廣東話語音搜尋功能,經過接近三年的發展,不論獨特的廣東話字詞、口音、甚或中英夾雜等情況,語音搜尋均能準確辨識。幕後研發此項目的Google研究部資深項目經理Linne Ha及亞太區本地化部門經理柳靈雨(Rain)表示:「希望可以為香港人提供最本地化的語言服務! 」

(左)Google研究部資深項目經理 Linne Ha
(右)Google亞太區本地化部門經理 柳靈雨(Rain)

只要前往Google主頁,搜尋欄旁邊可見咪高峰的圖示,代表可以使用語音搜尋服務。

Google於2010年12月首次推出廣東話語音搜尋服務,起初只得Android手機用得着。

除了Android平台之外,廣東話語音搜尋服務亦相繼推出iOS及電腦桌面版。

Linne表示手機等手提裝置輸入文字時相對較困難,所以語音搜尋將會愈見普及。

iOS用家需要事先安裝《Google Search》App,App內提供語音搜尋功能。

提供多種語言,使用前需要選擇「粵語(香港)」。

Android手機的語音搜尋功能已經結合到Google Now頁面,毋須另行下載程式。

內置多種中文語音搜尋,同樣需手動調校至「粵語(香港)」方能使用廣東話語音搜尋。

系統收錄港人常見的懶音,如女人街的「女」字正確讀音為neoi5,但常錯讀成leoi5,但系統均能成功辨認。

中英夾雜亦為港人習慣,廣東話語音搜尋亦能辯認出中英文混合的查詢如「香港Disney」。

試讀出「倫敦天氣」,系統亦能辨認,並提供當地的即時及未來天氣資訊。

語音搜尋合手機用

廣東話語音搜尋自2010年12月登場後,這功能已先後推出了Android、iOS及電腦桌面版本,而使用人數亦與日俱增。Linne表示:「相信語音搜尋日後的應用將會更多廣泛,手提裝置是未來的趨勢,但一般手機裝置的虛擬鍵盤的尺寸較小,輸入文字時相對困難。語音搜尋則以簡單的說話形式取代輸入法,比傳統打字更方便和易用。」Rain則指出:「語音搜尋為用家提供了多一個輸入選擇,大家可以視乎情況和地點來選用;譬如駕駛時,語音搜尋就非常實用。」

專業數據收集

廣東話被譽為全球最難學習的語言之一,不但有九個音調,而且不同地區的說話語調、用字亦稍有差異,令廣東話語音搜尋的研發難度特別大。Linne認為研發初期,最重要是建立完整的廣東話語音資料庫:「聲音數據方面,我們使用專屬程式《DataHound》,及邀請香港及廣州本地人進行錄音,成功收集超過五十萬個廣東話聲音樣本,就連港人常見的懶音亦一併收錄,務求可以準確辨識。而文字數據方面,我們則利用google.com.hk 的搜尋記錄用來訓練系統,更有效了解港人的文字使用習慣,加強語音辨識的準確度。」Rain補充道:「系統懂得根據用家的搜尋結果而不斷調整和學習,所以用家使用愈頻繁,系統便會愈『聰明』!」

中英夾雜成挑戰

除了基本字詞外,港人於說話時亦有不少獨特習慣,Linne指出:「根據調查,香港有接近30%的用戶喜歡說話時夾雜英文,比起內地及台灣用戶來得多。為了提升系統的辨識能力,Google特別將英文詞語與連上一系列相關廣東話發音單元,是全球首個雙語混合搜尋系統,例如『香港Disney』中英混合的查詢,系統都可以成功辨識。」被問及日後的發展空間,Linne及Rain均透露:「現時系統對於一般廣東話的字詞、中英夾雜甚至口音都可以成功辨識,未來我們希望令系統可以辨識長串問題,並即時提供相關資料的搜尋結果,令使用更見方便。」