首頁>>廠商>>語音識別與合成>>科大訊飛

解放雙手 車載語音導航時代來臨

2009/06/30

  題記:中國汽車保有量迅速增加,中國導航設備普及率近年來雖持續(xù)快速增加,但相對于汽車總保有量來說,比例依然很低,遠低于歐美25%、日本 59%的普及率,發(fā)展空間極大。中國地大物博、交通情況復雜的特點也決定了導航設備在中國的應用更具必要性與現實意義,且中國導航產品具有突出的性價比優(yōu) 勢。語音技術與導航設備的結合是大勢所趨,既是用戶實際需求,又是導航產品的必然發(fā)展方向,市場空間極為廣闊。那么什么是語音技術?語音技術的發(fā)展現狀怎 樣?它到底是如何與導航產品結合的?它將給未來的汽車帶來哪些價值?

語音導航國際發(fā)展趨勢

  從全球汽車產業(yè)發(fā)展狀況來看,語音技術在車載導航中的應用是一種新的趨勢。傳統的車載導航產品,是用眼睛看的方式獲取相關信息,對汽車駕駛者而言存在一定的安全隱患。因此,基于廣大汽車駕駛者安全性、舒適性考慮,將語音技術應用于導航領域是必然趨勢。

  語音技術在車載導航中的應用已成為國際汽車發(fā)展的必然趨勢,這將真正實現人機語音交互。目前,雷克薩斯采用了來自Voice Box Technologies公司的語音識別(VR)解決方案。奧迪也正在專注于改善其語音識別,并推出了新的升級版軟件來更新其MMI,使其變得更加用戶友 好。同時,更多整車廠也在為車載導航產品積極尋求適合的語音技術解決方案。

  國際上每年都有舉辦“Blizzard Challenge”比賽,它是國際英文語音合成研發(fā)領域最高級別的賽事,參賽單位包括中國的科大訊飛、美國麻省理工學院(MIT)、卡耐基-梅隆大學 (CMU)、IBM 研究院、微軟研究院、英國愛丁堡大學、日本ATR(國際電氣通信基礎技術研究所)等國際一流的語音研究機構,在一起既同場競技,又共同交流技術。

  在不遠的將來,語音車載導航技術的以及整車語音技術的應用水平,將成為衡量高端車型的一個重要標準。在更長遠的時間里,語音技術在汽車上的應用將更為普遍,成為汽車的一項基本配置和功能。

語音導航國內發(fā)展狀況

  目前,國內汽車制造廠商就語音技術在車載導航中的應用已經達成了廣泛的共識,都在積極尋求語音技術提供商。與此同時,汽車制造廠商在尋求合作伙伴的時候從長遠發(fā)展角度考慮,重點關注語音技術提供商的綜合實力,要求技術供應商具有從語音合成到語音識別的全面技術領先。

  當前,將車載導航設備與語音技術結合,也成為了各廠商普遍關注的增加產品亮點和競爭力的一條重要途徑。

  對于車載導航來說,有了語音合成,無論是千變萬化的道路名稱,還是隨時到來的路況信息,都能隨時播報;有了語音識別,目的地設定、路況信息查 詢,只需說出命令即可完成操作。“合成+識別”的理念和解決方案,真正實現了交互式的語音導航系統,從根本上解決了安全隱患,提升了汽車駕駛樂趣。

  目前國內已推出的具有語音功能的導航產品中絕大部分應用的都是科大訊飛的語音合成技術,實現信息語音播報、語音操作提示等功能,并對于語音識別技術在導航產品中的應用與廠商共同合作進行預研和應用探討。

  據了解,在國內做語音導航研究的有多家公司,其中科大訊飛在中文語音合成、語音識別、口語評測等多項技術上擁有國際領先的成果。語音導航在車載 領域的應用上,當關閉車窗的情況下,只要是普通話或與普通話相近的方言,科大訊飛語音一次性識別正確率都可以達到90%以上。此外,語音識別功能的成本已 經大大降低,加入的硬件和軟件授權費都在廠商和用戶的接受范圍之內,與語音車載導航的高性能、高附加值相比,可以說微不足道。

語音導航的車載價值

  最大價值表現在:以語音合成、語音識別、語音編解碼為方向的智能語音技術應用在車載領域,將改變汽車現有的人機信息交流方式,解放駕駛者的雙手和雙眼,使汽車具備更人性化魅力,體現個性化特色,提高駕車安全性。

  未來,語音技術將會在車載中得到更大更廣泛的應用,通過“變看為聽”的車內語音信息服務,“君子動口不動手”的車內語音聲控操作,隨意調節(jié)車內 溫度、亮度等,使汽車操作更具人性化、趣味性,使駕駛者真正實現“易車生活”,將為汽車工業(yè)的發(fā)展帶來一場真正的革命。目前,隨著中國汽車工業(yè)的快速發(fā)展 和汽車保有量的增加,汽車消費者對于汽車性能提出了更高的要求,電子化、智能化和網絡化趨勢已成為當前汽車行業(yè)的流行主題,語音技術在汽車領域中的應用空 間十分廣闊。

  同時,智能語音技術在車載導航設備上的應用,亦對整個產業(yè)鏈的拓展、發(fā)展具有重要意義,提供了新的、廣闊的增值空間。

語音導航如何應用到車載

  語音識別技術的引用對硬件設備及軟件系統的支持能力會有更高的要求:

  其一,在硬件配合上,需要更高性能的處理器,區(qū)別于一般性能的高品質麥克風和適合錄音數據傳送的音頻電路,以此來保證識別引擎接受數據的完整性和可用性;

  其二,在導航軟件上,需要軟件開發(fā)商在搜索引擎的接口中加入便于語音識別系統可以調用的數據和命令菜單,以此來實現分類信息搜索、POI搜索和交叉路口搜索等功能。

語音導航應用的難題

  語音技術在車載導航中應用的技術難點可從語音合成、語音識別兩方面來看。

  語音合成方面,技術難點即在于語音合成的技術水平與質量。語音識別方面的技術難點主要表現在對眾多口音和方言的支持、對車內噪音環(huán)境的適應和處理,以及命令中關鍵詞的提取上。

  中國地大物博,方言有幾千種,部分方言與普通話差別甚大,基于標準普通話的語音識別系統在識別帶有方言口音的普通話時,識別率會下降很多。

  對于中文語音識別應用中經常面臨的方言口音、復雜信道和背景噪聲等問題,依據從實際業(yè)務系統中收集的涵蓋不同方言和不同環(huán)境噪聲的海量語音數據,采用最新的區(qū)分性訓練方法進行語音建模,從而使語音識別產品在復雜應用環(huán)境下可以擁有良好的一致性效果表現。

  “隨意說”的難點在于核心命令詞的提取、語意分析。該技術使用戶可以自如地以自然語言與智能語音信息服務系統進行交互,經過引擎的自然語意分析理解而得到用戶的意圖,再反饋給用戶對應的需求信息,從而引導用戶達到其預想的目標。

  另外,在車輛使用過程中,發(fā)送機的運轉聲、空調噪音、窗外環(huán)境的噪聲和風噪等各類噪音會對車內的語音識別效果形成一定的影響。總而言之,解決應用技術難點的核心在于語音技術供應商在核心技術、語音資源庫等方面的長期積累、研究。

  在國內,一直在智能語音技術較為領先的科大訊飛公司,通過多年的研究積累了大量的方言數據庫,語音合成技術已經達到不僅能生成標準流暢的普通話,而且可以支持四川話、河南話、湖南話、東北話等幾乎全部的主流方言。

語音導航如何操作?

  兩個前提:第一,需要導航軟件廠商將車載設備可以支持的命令詞內容信息告知用戶(這些內容可能是在導航菜單界面的功能名稱,也可能是用戶自行設 置的目的地名稱及手機聯系人的名稱等);第二,車載設備商可以在方向盤或車載導航儀上安裝一個語音識別啟動按鍵,通過按動識別鍵啟動語音控制系統,用戶對 著識別麥克說出自己的需求,系統通過識別用戶的語言,實現用戶的需求。

  在實際使用中,如用戶需要導航儀尋找當前所在位置附近的加油站,按動識別鍵后直接對著麥克風說“導航到附近加油站”,導航儀會將搜索到的附近加油站的位置和具體信息通過圖形顯示和語音回饋給用戶。

  當用戶需要查詢某一位置時可以說出此POI的名稱,如“家樂福超市”,識別系統便會結合搜索引擎按照由近至遠的方式為用戶列出附近的家樂福超市的位置信息;另外,用戶也可以說出希望去往的某個交叉路口的名稱,如“深南大道和農林路交叉口”等找到目的地。

  隨著智能語音識別技術的不斷完善,數據資源的不斷積累,用戶可以不拘于固定的語言表達方式而用較為自然的語音進行命令輸入,如“導航到某某地”這樣的命令也可以說成“我想去某某地”、“某某地在哪”或“帶我去某某地”等多種表述方式,語音系統都可以正確識別并處理。

語音導航其它應用

  語音識別技術在車載影音娛樂、通信系統、舒適系統中得到了更廣泛的應用,語音技術將進一步增強汽車的安全與舒適性能。

  語音系統可以實現CD、MP3、收音機功能控制,也可以實現語音點歌搜索:用戶只要說出歌手或歌曲名稱,或者哼唱一段歌詞,車載MP3就會搜索 到你想要聽的音樂。通信方面,車載設備通過藍牙與手機連接后,只要對其說出人名或號碼,手機就會進行自動撥號。另外,通過聲控可以實現車內溫度、亮度等調 節(jié),使駕駛者能夠真正享受到車內舒適生活。除了語音識別技術,語音合成系統可以實現對汽車油量、電量、胎壓以及速度的播報及聲控結果的反饋確認等。

  基于汽車的安全性能考慮,對車載的功能進行控制沒有復雜的操作程序,只需要通過開口說話就可以解決。另外,針對在車內環(huán)境的智能語音應用場景, 也會設計一整套語音交互的流程方案,更加方便用戶接受和使用。在語音識別引擎獲得用戶命令到正確反饋信息的時間是相當短暫的,以毫秒計算,這個過程完全不 會影響到用戶的使用。

  未來,語音系統將成為車載內信息獲取、互動娛樂、程序操控的重要工具,真正成為車載設備綜合控制終端,解放駕駛者的雙手,為改善行車安全、提升車載娛樂價值、促進車載信息化發(fā)揮舉足輕重的作用。

CTI論壇編輯


相關鏈接:
訊飛語音助新奧燃氣實現智能化客服中心 2009-06-29
科大訊飛推出新一代語音芯片XFS4041CN 2009-06-26
科大訊飛獲09中國軟件自主創(chuàng)新最具實力獎 2009-06-24
訊飛語音軟件入選首批國家自主創(chuàng)新產品 2009-06-15
訊飛語音引領車載導航新世代 2009-06-09
南木林县| 巴南区| 龙江县| 东安县| 方城县| 平南县| 横峰县| 邛崃市| 肇州县| 察雅县| 乌什县| 潼南县| 襄城县| 桃源县| 辉南县| 喜德县| 高阳县| 峡江县| 文山县| 海丰县| 禹城市| 齐河县| 含山县| 项城市| 甘肃省| 荆州市| 嘉禾县| 塔城市| 甘洛县| 陇川县| 于田县| 沙河市| 乐亭县| 民乐县| 公安县| 都昌县| 梓潼县| 保定市| 溧水县| 利辛县| 洛浦县|