日前Apple新品發表會首度推出可進行Siri語音輸入蒐尋之Apple TV搖控器,加上Google布局已久的Google Now語音助理,及甫一上市即大打語音助理Cortana應用之微軟最新Win10 OS,可以窺知三大OS廠於人機介面技術的戰火,已由觸控技術進一步延伸至需整合更多軟體演算及人工智慧的語音辨識技術。
語音辨識技術能否臻於成熟,端視兩大技術環節發展是否夠快速,一是促進語音語意處理更貼近人類自然語言之強大處理器/雲端運算軟體技術,其次則為扮演降低環境干擾與提升環境安全關鍵要角之聲學感測技術(MEMS麥克風、Ultrasonic Sensor…)。
一、Apple Siri、Google Now、微軟Cortana三大語音助理短兵相接、語音辨識應用風潮持續延燒
二、語音辨識Sensor聲控應用-確保公共與居家照護安全
三、語音辨識Sensor之汽車/金融/數位看板應用-提升駕駛便利、強化商務行銷、降低金融服務成本
四、語音辨識Sensor之語言轉譯/醫療照護應用-增強觀光/語言學習效益、深化特殊障礙病患照護
圖1 語音辨識Sensor技術&應用情境
圖2 語音辨識Sensor之汽車、數位看板、金融應用
圖3 語音辨識Sensor之語言學習轉譯應用
圖4 語音辨識Sensor之醫療照護應用