【中國安防展覽網(wǎng) 企業(yè)關(guān)注】在過去六個月里,各大科技公司均通過發(fā)布新技術(shù)、新產(chǎn)品,展望了計算機的未來。有趣的是,所有公司的看法幾乎一致:未來,你可以和你的電腦聊天。
主流智能語音助手對比:智能有限 亂象先起
微軟將其稱之為“對話平臺”、谷歌則希望其應(yīng)用都具有“持續(xù)的雙向?qū)υ?rdquo;能力,而蘋果的Siri、亞馬遜的Alexa,實際上都能夠在不同程度上與人類溝通。Facebook CEO扎克伯格則進行了進一步總結(jié):“我們的人工智能目標是建立一個比人類感知更好的系統(tǒng),包括視覺、聽覺、語音等等”。
顯然,語音是關(guān)鍵。十幾年前的科幻電影中,我們已經(jīng)看到了各種各樣能夠與人類自然對話的電腦,這種趨勢在當時就已經(jīng)形成。隨著人工智能、云計算的發(fā)展,這些語音助手們將在基礎(chǔ)行業(yè)發(fā)揮更大作用,比如Domino比薩,已經(jīng)啟用了訂購助手多年。不過,這也說明了一個問題:各種語音助手和工具都各自為政,為自有平臺服務(wù),使得整個計算機語音市場極度混亂。
從說“嘿”到新的溝通級別
目前,世界上主流的語音主流包括Siri、Alexa、Cortana、Facebook M、谷歌助手等等,但真正具有影響力、開放的第三方產(chǎn)品。這種情況造成了硬件為王的發(fā)展趨勢,你需要選擇特定的硬件,來使用這些服務(wù)。另外,它們的定位也不盡相同,蘋果和谷歌更專注手機等移動產(chǎn)品及汽車,亞馬遜則放眼智能家居,微軟和Facebook的據(jù)點不太確定,但同樣,涉及很多領(lǐng)域。
今年,科技公司對于自然語音處理技術(shù)的關(guān)注更加深入,從3月開始,微軟推出了一套AI開發(fā)工具,們可以使用它創(chuàng)建自己的人工智能應(yīng)用;4月,F(xiàn)acebook開放其Messenger應(yīng)用作為一個機器人平臺,“你永遠不用再撥打800客服電話了”,扎克伯格這樣說;而微軟CEO納德拉則將聊天機器人描述為“新型應(yīng)用程序”。
納德拉認為,未來類似Cortana或是Alexa將成為機器人們的老板,與用戶更深入的互動、溝通。然而,The Verge認為這可能是一個過于簡化的總結(jié),真正的情況會更混亂。語音助手與機器人的溝通會像與API溝通那樣順暢?這些不同的應(yīng)用程序如何安全地交換用戶數(shù)據(jù)?何種軟件會聽懂你的俚語并將其寫入郵件?你怎樣讓它們停下來?還有太多問題尚待解決。下面,一起來看看各種語音助手的發(fā)展情況及趨勢。
亞馬遜
Echo和Alexa的受寵,可能是亞馬遜一開始沒有預(yù)料到的。其服務(wù)基于家庭,Echo作為一個集成Alexa助手的硬件終端,始終在聆聽用戶的命令。在開放API之后,Alexa目前已經(jīng)支持1000多家服務(wù),其開發(fā)工具也非常簡單,亞馬遜表示可以在一個小時便完成軟件集成。
Echo之所以越來越強勢,是因為它掌握了一些基本規(guī)則,比如在房間中使用、Alexa的快速響應(yīng)能力和擴展性等等。另外,亞馬遜也開始允許其他硬件廠商植入Alexa。不過,Alexa并非沒有弱點,本質(zhì)上它不像SIri等語音助手般聰明,它更注重命令、而非自然語音處理。不過,有跡象表明亞馬遜將繼續(xù)改善完善Alexa,包括添加情感處理能力,這將有助于Alexa變得更加人性化、形象化。
蘋果
盡管蘋果是早推出語音助手的公司,但實際上已經(jīng)落后于競爭對手。Siri的語音識別能力不穩(wěn)定、功能限制,導(dǎo)少用戶使用。而在今年WWDC大會上,蘋果對Siri進行了一些加強,包括集成第三方服務(wù)、兼容Mac等,這使其看上去更好用。
另外,iOS平臺的強勢,有機會讓Siri無處不在,包括你的手機、電腦、汽車,這是微軟和亞馬遜不具備的優(yōu)勢。當然,Siri需要更聰明,不僅僅是能講幾個笑話、能直接回答問題、能夠調(diào)用第三方應(yīng)用程序。而在目前階段,提升AI的一個有效方法是收集用戶數(shù)據(jù),但蘋果表示將盡可能不使用這種方法來實現(xiàn)機器學(xué)習,具體效果如何,還有待時間來驗證。
Facebook
Facebook在語音助手的競爭中可能是弱勢的,主要是它在聊天應(yīng)用中集成的數(shù)字助理,更像是傳統(tǒng)的老式組合規(guī)則,而非AI。另外,用戶只能通過輸入文字提出問題,API會在數(shù)據(jù)庫中搜索相近答案,可能會耗時數(shù)分鐘才回答。當然,F(xiàn)acebook也有其長項,其機器學(xué)習團隊創(chuàng)建了一些圖像識別功能,具有顯著成效。
當然,F(xiàn)acebook需要加快腳步跟上競爭對手的腳步,提供更迅速、智能化的助手應(yīng)用,沒有人希望等上一個小時才知道今天天氣怎樣。
谷歌
在所有科技公司中,谷歌的資源實際上具優(yōu)勢,因為它本身是大的搜索引擎,并且不避諱收集用戶數(shù)據(jù),對于機器學(xué)習、語音助手發(fā)展來說是寶貴的資源。今年5月,谷歌在I/O大會上非常強勢地表達了發(fā)展AI的愿景,包括推出谷歌助手服務(wù)、谷歌Home音箱等等,服務(wù)涉及到智能手機、應(yīng)用甚至是智能服裝,令人印象深刻。
另外,谷歌對于機器學(xué)習、AI的研發(fā)也比其他競爭對手更積極,包括AlphaGo、開源的機器人學(xué)習軟件Tensor Flow等等,這意味著它極有可能在消費級的語音助理領(lǐng)域獲得更多份額。同時,谷歌在本月發(fā)布針對企業(yè)的Springboard搜索服務(wù),其中包括對用戶提出可行性建議和信息的功能。雖然這是一種相對低層次的AI功能,但谷歌產(chǎn)品所擁有的廣泛覆蓋面,會為其全面發(fā)展AI帶來優(yōu)勢。
微軟
微軟Cortana大的不同是它幾乎沒有移動平臺(Windows Phone已回天乏術(shù)),所以Windows 10成為其根據(jù)地。而由于Windows 10的全平臺化,Cortana會出現(xiàn)在臺式機、筆記本甚至是Xbox上,從某種角度來說也成為電視語音助手。
雖然你可能并不會在PC上使用Cortana,但微軟已經(jīng)將聊天機器人、語音助理放到相當重要的位置,在今年3月的Build大會上,它推出了Bot Framework、一套AI開發(fā)工具,幫助創(chuàng)建自己的聊天機器人。聽上去,微軟似乎是“淘金熱”中的一員,但無論其動機是什么,都會促進該行業(yè)的發(fā)展。
其他
市場中不乏一些小公司帶來的語音助手軟件,諸如Hound、Amy、Viv等,其中Viv還是來自前Siri,他認為蘋果的平臺不足以帶動Siri發(fā)展,所以創(chuàng)造了Viv。另外,還有諸如幫助用戶訂購午餐的Howdy等簡單的機器人,以及類似Chatfue、Msg.ai等機器人平臺和工具包。
對于這些小規(guī)模的公司來說,其產(chǎn)品的大劣勢在于沒有關(guān)注度和平臺優(yōu)先度。即便它們的形式可能是更廣泛的Web、或是兼容多系統(tǒng)的應(yīng)用,但沒有人使用,便無法獲得用戶、生成數(shù)據(jù)和進步。試想一下,即便Viv很聰明,但人們使用的是蘋果iPhone,Siri無疑是具有平臺優(yōu)先級的,這是Viv*的優(yōu)勢。
接下來呢?
The Verge認為,從目前的發(fā)展趨勢來看,混亂將是語音助手們帶給用戶的直接感受。你可能需要同時面對PC上的Cortana、手機上的Siri或是谷歌助手,回到家中使用Alexa,開車時再用回Siri,這種分裂式的使用體驗與平臺之爭有著必然聯(lián)系,也是無法避免的。畢竟,它們都是商品,都是廠商用戶*的工具。
當然,數(shù)字世界是不斷發(fā)展的,想想過去十年技術(shù)的進步。隨著智能助理、語音助手們在更多領(lǐng)域流行起來,它們終可能會找到一種共存的方式,更像是同伴,而不是競爭對手。未來有一天,你可能會感到與電腦聊天更加舒服愜意。