【安防展覽網(wǎng) 媒體導讀】“Alexa,今天的天氣怎么樣?我出門需要帶傘嗎?”
“Hi,Siri,請幫我定一個下午3點的鬧鐘。“
……
在不久的將來,人們與語音助手的對話將成為生活中的常態(tài)。無論是亞馬遜、谷歌、蘋果、微軟這些科技巨頭,還是思必馳、出門問問這些后起之秀目前都在大力布局,希望搶占語音時代的發(fā)展“智”高點。
“早起”的蘋果和“遲到”的臉書
語音技術(shù)的發(fā)展或要追溯到1952年,貝爾實驗室制造的自動數(shù)字識別機“Audrey”,它可以識別數(shù)字0—9的發(fā)音,且準確率高達90%以上。
這被視為語音助手開啟歷史巨幕的起點,近幾年隨著云計算、大數(shù)據(jù)、人工智能等高新技術(shù)的發(fā)展,智能語音助手才開始真正走進人們的生活。
大部分人次接觸語音助手,都是從蘋果手機上的Siri開始。其實,蘋果就是中個發(fā)布語音助手的科技巨頭企業(yè)。2011年,蘋果在iPhone4S的產(chǎn)品發(fā)布會上推出了語音助手Siri。
但可惜的是,蘋果“起了個大早,趕了個晚集”,雖然先于亞馬遜推出語音助手,但如今的市場份額卻遠遠落后于Alexa。根據(jù)市場研究機構(gòu)Ovum發(fā)布的數(shù)據(jù)顯示,目前亞馬遜Alexa和谷歌Assistant的用戶基數(shù)超過了95%,而蘋果Siri只有24%。
在隨后的幾年,谷歌和微軟分別推出了語音助手Assistant和Cortana,與Siri和Alexa并稱為“語音四大天王”。在距離蘋果推出Siri整整8年后,作為一家沒有推出語音助手的科技巨頭——臉書終于坐不住了。5月31日,臉書執(zhí)行官馬克·扎克伯格對外稱,公司正在開展人工智能語音助手的研發(fā)。
此前,由于沒有自研語音技術(shù),臉書推出的兩款Portal視頻聊天設(shè)備都是搭載亞馬遜Alexa語音助手,無疑這讓臉書在人工智能的發(fā)展中處于“被動”地位。這也是即使已落后“語音四大天王”一大截,臉書也要自己開發(fā)語音助手的主要原因。
讓語音助手聽懂“人話”是關(guān)鍵
語音助手的快速發(fā)展需建立在其能聽懂“人話”的基礎(chǔ)上,不然其在“智能”與“智障”之間只有一線之差。
目前,在語音技術(shù)的升級上,科技巨頭一方面通過自身加強技術(shù)創(chuàng)新迭代,另一方面通過收購初創(chuàng)企業(yè)來鞏固業(yè)內(nèi)地位。
6月4日,蘋果在大會上宣布將對語音助手Siri進行升級,并將在今年秋天公布7大新功能。蘋果方面表示,Siri很快會有完全由軟件生成的新聲音,這將使聲音聽起來更加準確。
為了鞏固在智能語音市場的地位,亞馬遜特別成立了一支1億美元的投資基金,專門投資圍繞語音應用開發(fā)產(chǎn)品的創(chuàng)業(yè)公司。與其它公司相比,亞馬遜的優(yōu)勢是可以為合作伙伴提供電商、搜索等領(lǐng)域的渠道支持。
微軟也通過“買買買”的方式不斷對Cortana進行迭代升級。今年微軟剛剛收購了加拿大人工智能初創(chuàng)企業(yè)Maluuba,這將進一步強化Cortana的機器閱讀和編寫能力。
無論是依靠自身迭代還是通過外圍收購,巨頭們的目標只有兩個。,通過技術(shù)迭代,讓語音助手更好地與人類交流,搶占市場占有率;第二,以智能語音技術(shù)為支點,撬動在醫(yī)療、教育、家居、汽車、樓宇等領(lǐng)域的智能化發(fā)展。
智能語音發(fā)展還需跨過“三座大山”
根據(jù)研究機構(gòu)Juniper Research發(fā)布的數(shù)據(jù)顯示,2023年語音助手的使用量將達到 80億,市場規(guī)模則將達到800億。雖然智能語音市場正快速增長,但距離行業(yè)的真正成熟發(fā)展還需跨過“三座大山”。
1.支持更多的語言。目前,谷歌Assistant已在80個國家支持30種語言,語言數(shù)位列第二的蘋果Siri則支持36個國家的21種語言。但無論是Alexa亦或者是Siri,都聽不懂俄語,這給俄羅斯本土搜索巨頭Yandex推出的語音助手Alice創(chuàng)造了巨大的發(fā)展空間。
同時,作為Yandex的合作伙伴,化AI+IoT平臺涂鴉智能正通過“Powered by Tuya”技術(shù),幫助Yandex打破不同品牌和設(shè)備之間的信息孤島問題,加速搶占俄羅斯智能家居市場。
2.加速商業(yè)化落地。任何一項技術(shù),沒有成熟的商業(yè)落地解決方案,都不能取得長足的發(fā)展。智能語音市場既有谷歌、亞馬遜等巨頭的布局,也不乏思必馳、Rokid、出門問問這些初創(chuàng)企業(yè)的入場,可謂是玩家越來越多,但目前語音技術(shù)的商用落地還在進一步探索中。只有具備一套完善、成熟的商業(yè)落地解決方案,未來才能推動相關(guān)產(chǎn)業(yè)的可持續(xù)發(fā)展。
3.更好地理解人類語言。語音助手不應該僅僅“聽懂人話”,更應該根據(jù)不同的場景來理解用戶的指令,甚至讀懂用戶的語氣?;ヂ?lián)網(wǎng)女皇瑪麗·米克爾在《互聯(lián)網(wǎng)趨勢》報告中提到,假如語音助手能進一步理解人們說的話,那么語音技術(shù)將迅速普及,甚至改變行業(yè)現(xiàn)有的發(fā)展格局。當然,這對科技公司的技術(shù)能力將是一大挑戰(zhàn)。
跨越了這“三座大山”,語音技術(shù)才能真正進入商業(yè)應用的成熟期,在教育、家居、醫(yī)療、汽車等領(lǐng)域開辟出新天地。