【中國安防展覽網(wǎng) 企業(yè)關(guān)注】近年來,隨著人工智能熱潮的襲來,以智能語音為代表的各類應(yīng)用也層出不窮。如QQ閱讀調(diào)用訊飛語音合成技術(shù)推出有聲聽書;蝦米音樂使用訊飛語音識別技術(shù),推出哼唱檢索……
有關(guān)于未來生活,腳不沾地、手不動彈,人躺在床上動動嘴皮子就能操縱一切,想喝酒就吧唧吧唧嘴的喝,想吃豆就嘎嘣嘎嘣脆的嚼,想看電視、玩電腦,屏幕能自動出現(xiàn)在你面前,想聊天,機(jī)器人就陪你聊天,這樣的場景不止一次出現(xiàn)在人們的想象中??赡苓€會有腦洞大開或是懶癌末期的人,連嘴皮子都不想動,借助腦電波就想操縱一切。這個想法就不太現(xiàn)實(shí)了,先不說接受腦電波的傳感器是什么,技術(shù)難度有多大,單說人的思緒瞬息萬變,從巨量信息中找出有效指令就實(shí)屬不易了。
目前,咱們還是先探討一下聊天機(jī)器人的可行性吧。
語音識別技術(shù)的前世今生
說起語音識別,大部分人腦子里竄出來的個單詞可能就是“Siri”,然后就是第二個單詞“智障”。早些時候,Siri的反應(yīng)是有點(diǎn)“虎”,答非所問不說,吹噓的語音控制功能也形同雞肋。但毫無疑問,語音識別市場的蛋糕的確就擺在了那里,各大企業(yè)也摩拳擦掌,想要摘下蛋糕頂上的草莓。
2014年5月29日,微軟亞洲互聯(lián)網(wǎng)工程院發(fā)布一款人工智能伴侶虛擬機(jī)器人,并取名“微軟小冰”。3天之后,“微軟小冰”在和網(wǎng)友的對話中學(xué)會了滿嘴臟話,被緊急下架。2014年7月2日,微軟宣布全新微軟二代小冰已正式發(fā)布。目前,小冰已經(jīng)迎來了第五代。“小冰是一個聊天機(jī)器人,但不僅僅是一個聊天機(jī)器人,”微軟執(zhí)行副總裁沈向洋表示,“聊天只是用戶的一個體驗(yàn),但我們設(shè)計(jì)產(chǎn)品理念的真正核心在于打造一個情感計(jì)算框架,同時擁有許多生存空間、輔助設(shè)備及相關(guān)設(shè)備,令小冰能夠與人類在任何地點(diǎn)及場景進(jìn)行交流。”
除了微軟,韓國巨頭三星電子也在積極布局。2017年11月30日,三星款智能語音助手Bixby將和用戶見面。Bixby不僅支持語音操作,備忘錄甚至是圖像識別也都可以支持。Bixby中文版開發(fā)由中國團(tuán)隊(duì)負(fù)責(zé),所以語言方面更懂中文。據(jù)三星介紹經(jīng)過不斷訓(xùn)練,Bixby識別中文的能力更強(qiáng),復(fù)雜的中文一般都難不倒它。同時,Bixyby內(nèi)置的學(xué)習(xí)型AI,通過大量用戶數(shù)據(jù)的不斷學(xué)習(xí),尤其是教習(xí)Bixby準(zhǔn)確理解與正確行為的反饋數(shù)據(jù),配合后臺深度學(xué)習(xí)機(jī)制,Bixby可以實(shí)現(xiàn)迭代更新,不斷升級各項(xiàng)能力。
微軟和三星熱火朝天吃蛋糕的同時,Siri也在快速發(fā)育。盡管早期Siri的智障表現(xiàn)引得眾人吐槽,但蘋果的資金和強(qiáng)大的研發(fā)實(shí)力不容小覷。有言道:“士別三日,當(dāng)刮目相看。”一直出現(xiàn)在大眾視野中、隨著蘋果設(shè)備在更新的Siri已經(jīng)逐漸完善,只是大眾對它失去了新鮮感,才使得它被提及的次數(shù)略少。另一方面,由于蘋果手機(jī)硬件方面的變動較大,Siri已不再位于蘋果宣傳策略的中心位置,但其功能的改進(jìn)和完善一直在日趨精進(jìn)。從綜合方面來講,Siri還是目前語音識別技術(shù)的*。
除了技術(shù)的革新之外,語音識別的應(yīng)用場景也在擴(kuò)大。智能家居行業(yè),是語音識別技術(shù)大的落地應(yīng)用市場,智能電視、智能音箱、語音識別智能鎖、服務(wù)機(jī)器人等等產(chǎn)品層出不窮,在市場上有很大的反響。
語音識別技術(shù)剛誕生的時候,在其設(shè)想中,應(yīng)該是和人工智能并駕齊驅(qū)的。人們渴望的是擬人化的交互、真實(shí)的聊天場景再現(xiàn)。之前有人認(rèn)為,這些都將會在2017年實(shí)現(xiàn)。如今到了年末,語音識別技術(shù)上有了前進(jìn),聊天機(jī)器人的應(yīng)用場景卻還沒鋪設(shè)開。事實(shí)上,也沒那么好鋪設(shè)。
技術(shù)不成熟
以自然語言理解下的一個子問題“用戶意圖識別(intentionrecognition)”為例,目前在學(xué)術(shù)界前沿的研究成果之一,F(xiàn)acebookAIResearch發(fā)表的End-To-EndMemoryNetworks算法,在開放領(lǐng)域的多輪對話的意圖識別準(zhǔn)確率低于70%,而這只是學(xué)術(shù)界小規(guī)模的數(shù)據(jù)集的好的結(jié)果,工業(yè)界有更多更復(fù)雜的情況要處理,數(shù)據(jù)量會更大,準(zhǔn)確率會進(jìn)一步下降。而識別準(zhǔn)確率小于95%是很難大規(guī)模應(yīng)用的。
這只是用戶意圖識別的一個瓶頸,在對話上下文建模、對話過程中的知識表示上還有諸多技術(shù)挑戰(zhàn),短期內(nèi)很難突破。
還是要依靠人工
在電商領(lǐng)域,涉及到個性化服務(wù)的一些品位、時尚等非理性因素也是機(jī)器沒有辦法理解的,靠人工也許是一個更好的選擇。
不能雪中送炭
在目前階段,聊天機(jī)器人可以信息提供和信息收集工作,免于一些重復(fù)的工作,但是這可能只占整個服務(wù)流程的10%,甚至5%,剩下的核心的用戶體驗(yàn)不是聊天機(jī)器人可以控制的。
聊天機(jī)器人是一個可以添加的功能(nicetohave)或者是噱頭,但卻不可能成長為核心功能和主要賣點(diǎn)。
聊天機(jī)器人如果想成為殺手級應(yīng)用,或者意圖顛覆現(xiàn)有的流程,必須在用戶體驗(yàn)或者是方便性上有質(zhì)的提升,否則很難從已經(jīng)使用良好的網(wǎng)頁端或者APP上來搶用戶。簡單的說,如果聊天機(jī)器人在方便性上只能提升5%左右,為什么要舍棄成熟的方式來使用聊天機(jī)器人?
總結(jié)
目前來看,移動聊天平臺、語音和語音智能助手等的應(yīng)用層出不窮,即使聊天機(jī)器人技術(shù)未成熟,語音智能助理也可以得到廣泛的應(yīng)用。但在技術(shù)無法突破的情況下,聊天機(jī)器人在很長的一段時間內(nèi)都會是看上去很美,實(shí)際沒有多少創(chuàng)業(yè)機(jī)會,只會淪為大公司的玩具。
原標(biāo)題 機(jī)器人什么時候能陪我們聊天?