avav588con,最近2019中文免费字幕在线观看,欧美一道本一区二区三区,九九热在线观看,经典好看免费AV

移動(dòng)版

當(dāng)前位置:智慧城市網(wǎng)資訊中心媒體導(dǎo)讀

新發(fā)產(chǎn)品更多
動(dòng)口不動(dòng)手 智能語音讓我們個(gè)個(gè)成君子
2015年11月09日 11:33:26來源:InfoQ點(diǎn)擊量:12872
導(dǎo)讀隨著移動(dòng)互聯(lián)網(wǎng)的大規(guī)模爆發(fā),作為主要載體的智能手機(jī)在打字輸入方面越來越依賴語音輸入,而語音識(shí)別技術(shù)也逐漸變成了必需品。
  【中國(guó)安防展覽網(wǎng) 媒體導(dǎo)讀】隨著移動(dòng)互聯(lián)網(wǎng)的大規(guī)模爆發(fā),作為主要載體的智能手機(jī)在打字輸入方面越來越依賴語音輸入,而語音識(shí)別技術(shù)也逐漸變成了必需品。在百度,語音識(shí)別技術(shù)早已納入需求向服務(wù)轉(zhuǎn)變的進(jìn)程中,其實(shí)百度語音技術(shù)就在我們身邊:搜索、地圖、應(yīng)用、音樂、瀏覽器等領(lǐng)域無處不彰顯語音技術(shù)的風(fēng)采,也是它讓我們進(jìn)入了“動(dòng)口不動(dòng)手”的時(shí)代。
  
  上個(gè)月,以“智能語音技術(shù),簡(jiǎn)化你我日常生活”為主題的百度技術(shù)沙龍活動(dòng)中,來自百度中心的語音專家就分享了百度在智能語音上的相關(guān)成果和進(jìn)展。演講嘉賓分別是百度語音技術(shù)部項(xiàng)目經(jīng)理關(guān)勇、語音開放平臺(tái)產(chǎn)品經(jīng)理穆向禹和百度平臺(tái)產(chǎn)品設(shè)計(jì)師董經(jīng)緯。
  
  百度語音技術(shù)及新進(jìn)展
  
  百度語音部門成立于2010年,在2013年的時(shí)候已經(jīng)展現(xiàn)出了從無到有的華麗轉(zhuǎn)變,碩果累累?,F(xiàn)已在行業(yè)里取得了不錯(cuò)的成果,正如關(guān)勇所說,百度在做技術(shù)的同時(shí),不僅服務(wù)于自己的產(chǎn)品和應(yīng)用,還會(huì)把一些比較特殊的技術(shù)開放出來,供廣大分享、使用、協(xié)作。實(shí)際上,智能語音技術(shù)關(guān)鍵的兩點(diǎn)是語音識(shí)別技術(shù)和語音合成技術(shù)。識(shí)別技術(shù)即:將聲音轉(zhuǎn)化為文字,讓應(yīng)用長(zhǎng)上耳朵;合成技術(shù)即:將文字轉(zhuǎn)化為聲音,讓應(yīng)用開口說話。
  
  目前百度語音采取的語音識(shí)別技術(shù)主要是場(chǎng)景化識(shí)別,自選語言模型:這其中的細(xì)節(jié)包括:長(zhǎng)文本語音輸入、短語熱詞識(shí)別、交互式對(duì)話垂直領(lǐng)域識(shí)別、語音糾錯(cuò)技術(shù)。正是基于這些技術(shù),百度語音的識(shí)別功能已經(jīng)在業(yè)界有了一定的地位,主要體現(xiàn)在這些方面:
  
  數(shù)萬小時(shí)的聲學(xué)訓(xùn)練語料,百度搜索引擎技術(shù)積累的海量文本語料。更的基于聽覺感知DNN聲學(xué)建模技術(shù),更高的識(shí)別率。線上語言模型體積100GB-1TB,更廣泛的語言覆蓋范圍。小時(shí)級(jí)別的海量語言模型動(dòng)態(tài)更新,更快追蹤熱詞。高速動(dòng)態(tài)WFST一遍解碼技術(shù),中國(guó)快的語音輸入法產(chǎn)品技術(shù)。
  
  新技術(shù)帶來識(shí)別率的顯著提升
  
  百度語音架構(gòu)師賈磊在剛剛進(jìn)行的第十三屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議上做的專題報(bào)告,詳細(xì)介紹了百度在語音識(shí)別技術(shù)上的新進(jìn)展,即LSTM建模和CTC訓(xùn)練在語音建模技術(shù)中的應(yīng)用,將通用文本安靜環(huán)境普通話識(shí)別率提升到接近97%??偟膩碚f,百度的語音技術(shù)已經(jīng)達(dá)到了水平,在識(shí)別率上超過相同競(jìng)爭(zhēng)產(chǎn)品。
  
  在語音合成技術(shù)方面,百度在海量文本信息處理技術(shù),基于LSTM的韻律建模技術(shù),基于LSTM的聲學(xué)參數(shù)建模技術(shù),基于大規(guī)模錄音語料智能彈性單元挑選技術(shù)等方面取得了重要突破,完成了業(yè)界的拼接合成和參數(shù)合成系統(tǒng),并提供體驗(yàn)的離在線融合語音合成服務(wù)解決方案。
  
  百度語音合成技術(shù)新推出了基于大數(shù)據(jù)的情感語音合成技術(shù),讓聲音合成擺脫平鋪直敘,使用戶體會(huì)更自然的發(fā)音,更豐富的情感和更強(qiáng)大的表現(xiàn)力,在沙龍演示的情感語音合成,引起的熱烈反響和濃厚興趣。目前該技術(shù)已經(jīng)在百度小說頻道上線,用戶可以在wifi環(huán)境下體會(huì)在線情感男聲的小說播報(bào)。目前的新進(jìn)展還體現(xiàn)在車載場(chǎng)景語音交互應(yīng)用Carlife上,這里面用到的技術(shù)點(diǎn)包括:麥克風(fēng)陣列及信號(hào)處理技術(shù)、的基于人類聽覺的CNN+DNN+LSTM語音識(shí)別技術(shù)、成熟的handfree喚醒技術(shù)、場(chǎng)景深度優(yōu)化技術(shù)、電話號(hào)碼和音樂信息智能糾錯(cuò)技術(shù)和基于用戶信息的個(gè)性化識(shí)別技術(shù)等等。
  
  百度語音在車載、家居、手機(jī)等方向的解決方案
  
  技術(shù)的意義在于將需求與服務(wù)連接起來,而產(chǎn)品則是連接人與服務(wù)的終介質(zhì)。百度語音開放平臺(tái)產(chǎn)品經(jīng)理穆向禹現(xiàn)場(chǎng)介紹了百度語音技術(shù)的應(yīng)用場(chǎng)景和解決方案。這里面首先要提出的是百度語音平臺(tái)的開放性,包括免費(fèi)的技術(shù)解決方案、分享廠商解決方案和個(gè)性化定制內(nèi)容。
  
  語音平臺(tái)的開放接入形式有很多種,例如RESTAPI方式接入——百度語音自主研發(fā)的語音識(shí)別技術(shù)API調(diào)用方式,采用http方式請(qǐng)求,適用于任何平臺(tái)的進(jìn)行語音應(yīng)用的開放;支持語音識(shí)別+語音合成接入;支持整段錄音文件識(shí)別;支持pcm、wav、opus、speex、amr、x-flac幾種語音格式的接入。此外還有SDK接入方式——支持純?cè)诰€和離在線兩種接入形式;支持Android和iOS系統(tǒng);支持多個(gè)垂直類優(yōu)化識(shí)別;支持用戶指令定制化識(shí)別等等。
  
  另一個(gè)能夠體現(xiàn)百度語音平臺(tái)開放特征的現(xiàn)象是為不同行業(yè)的企業(yè)和個(gè)人用戶提供的語音服務(wù),這些企業(yè)包括聯(lián)想、中興、特斯拉、現(xiàn)代、比亞迪、海爾、索尼和小米等等廠商。尤其是在車載和家居兩大塊,穆向禹著重以此為案例做了分析。百度語音技術(shù)在車載方面做了這么幾件事情。是為車載重點(diǎn)優(yōu)化語音喚醒,不但降低了功耗,還提升了穩(wěn)定性和準(zhǔn)確性。第二是在應(yīng)用端增加多信號(hào)處理技術(shù),針對(duì)不同的場(chǎng)景進(jìn)行深度優(yōu)化。其實(shí)在車載領(lǐng)域,百度對(duì)外開放的技術(shù)點(diǎn)還包括圖像、大數(shù)據(jù)、地圖以及相關(guān)的一些技術(shù)分支,和更多的共同打造一個(gè)車載環(huán)境。語音在這一環(huán)節(jié)里起到的是入口作用。
  
  在智能家居領(lǐng)域,百度語音的應(yīng)用場(chǎng)景也很廣泛。在智能電視方面有完整的基于MCU和ARM的解決方案,可以通過在遙控器上安裝自己開發(fā)的UI的方式,或者用手機(jī)離在線方案來控制一臺(tái)電視機(jī)。除此之外,百度語音技術(shù)團(tuán)隊(duì)的目標(biāo)是在明年把語音技術(shù)做到更加,不僅要滿足人們對(duì)洗衣機(jī)、冰箱這樣的傳統(tǒng)家居的智能化需求,還要做成一個(gè)智能生態(tài)圈,提供更多的解決方案。
  
  在未來,百度平臺(tái)將會(huì)開放更多的技術(shù)和應(yīng)用,包括支持識(shí)別方言功能,增加更多的車載應(yīng)用,增加多輪交互,聲紋識(shí)別,個(gè)性化TTS和音頻檢索等功能。
  
  怎樣從百度獲得更多分發(fā)和收入
  
  百度基于龐大的用戶基數(shù)和牢固的市場(chǎng)地位,在應(yīng)用分發(fā)上有很強(qiáng)大的優(yōu)勢(shì),正如百度平臺(tái)產(chǎn)品設(shè)計(jì)師董經(jīng)緯所言,百度分發(fā)量的*優(yōu)勢(shì)已經(jīng)持續(xù)兩年了,但其中的問題也開始慢慢顯現(xiàn)出來——分發(fā)量越高,意味著需要承擔(dān)更高的成本。這個(gè)時(shí)候就陷入一個(gè)怪圈:百度為什么要做分發(fā)?做分發(fā)是為了養(yǎng)用戶,養(yǎng)用戶是干什么用的?沒有用戶哪來的分發(fā)?這種“為了分發(fā)而分發(fā)”的模式,沒能為百度帶來更多的實(shí)際價(jià)值。
  
  如何解決這個(gè)問題呢?生態(tài)!董經(jīng)緯強(qiáng)調(diào)說,百度要想從分發(fā)上得到更多的好處,生態(tài)是很好的出路。提到生態(tài),不得不講明這其中的三個(gè)誤區(qū)。誤區(qū)一:生態(tài)=賠本賺吆喝。平臺(tái)不可能“只投入,不產(chǎn)出”。誤區(qū)二:生態(tài)要由買單。生態(tài)服務(wù)可替代性強(qiáng),收費(fèi)潛力有限,何況大部分入不敷出。誤區(qū)三:生態(tài)只能降低開發(fā)成本。那么,如何用正確的姿態(tài)玩生態(tài)呢?對(duì)百度而言,要讓每一次分發(fā)對(duì)百度產(chǎn)生用戶價(jià)值以外的意義,例如:數(shù)據(jù)、分發(fā)量、收入;對(duì)而言,在通過使用生態(tài)服務(wù)降低開發(fā)成本的同時(shí),還要能獲得分發(fā)量、額外收入。具體的落地形式包括:應(yīng)用內(nèi)容前置、生態(tài)SDK統(tǒng)一、前向付費(fèi)嘗試。
  
  應(yīng)用內(nèi)容前置,是指百度提供內(nèi)容對(duì)接方案,允許挖掘應(yīng)用特色信息,自助完成內(nèi)容對(duì)接;百度將優(yōu)先、集中展示對(duì)接應(yīng)用,給帶來分發(fā)量和特色信息的曝光。生態(tài)SDK一站接入,是指“一個(gè)平臺(tái):app.baidu.com”和“一次SDK接入”,讓可以快速接入、使用多種SDK,并因此得到分發(fā)量上的合作加權(quán),這迅速提高了百度生態(tài)SDK的市場(chǎng)覆蓋率。前向付費(fèi)嘗試,是指百度將提供多種形態(tài)的支付場(chǎng)景,可以選擇接入,降低自行嘗試用戶付費(fèi)模式的試錯(cuò)成本,畢竟離開錢,就不會(huì)有生態(tài)。
  
  后,董經(jīng)緯講到了分發(fā)平臺(tái)寡頭化的影響。分發(fā)市場(chǎng)從早期的群雄逐鹿,到現(xiàn)在的鼎足而三,寡頭化縮小了用戶下載應(yīng)用的選擇范圍,從而讓“應(yīng)用”的出現(xiàn)成為了可能——在應(yīng)用市場(chǎng)同質(zhì)化嚴(yán)重的今天,應(yīng)用內(nèi)容的差異化也許將成為各方角逐的下一個(gè)焦點(diǎn)。
  
  在后的環(huán)節(jié)里,百度中心語音開發(fā)創(chuàng)新大賽的總負(fù)責(zé)人辛宇給在場(chǎng)的聽眾介紹了大賽相關(guān)流程和細(xì)節(jié),并邀請(qǐng)了本次參賽者宋樂展示了他的參賽作品。
關(guān)鍵詞 智能語音智慧生活智慧城市
相關(guān)閱讀更多
版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明“來源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智慧城市網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它來源(非智慧城市網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

正在閱讀:動(dòng)口不動(dòng)手 智能語音讓我們個(gè)個(gè)成君子
我要投稿
  • 投稿請(qǐng)發(fā)送郵件至:(郵件標(biāo)題請(qǐng)備注“投稿”)afzhan@foxmail.com
  • 聯(lián)系電話0571-87756384
智慧城市行業(yè)“互聯(lián)網(wǎng)+”服務(wù)平臺(tái)
智慧城市網(wǎng)APP

功能豐富 實(shí)時(shí)交流

智慧城市網(wǎng)小程序

訂閱獲取更多服務(wù)

微信公眾號(hào)

關(guān)注我們

抖音

智慧城市網(wǎng)

抖音號(hào):afzhan

打開抖音 搜索頁掃一掃
i

視頻號(hào)

AF智慧城市網(wǎng)

視頻號(hào)ID:sphF7DOyrojJnp8

打開微信掃碼關(guān)注視頻號(hào)

小紅書

智慧城市

小紅書ID:2537047074

打開小紅書 掃一掃關(guān)注
反饋