avav588con,最近2019中文免费字幕在线观看,欧美一道本一区二区三区,九九热在线观看,经典好看免费AV

移動(dòng)版

當(dāng)前位置:智慧城市網(wǎng)資訊中心視點(diǎn)跟蹤

新發(fā)產(chǎn)品更多
各大企業(yè)為何競(jìng)逐人工智能芯片?
2019年09月18日 09:15:48來(lái)源:CPS中安網(wǎng)點(diǎn)擊量:38021
導(dǎo)讀隨著人工智能需求發(fā)展,神經(jīng)網(wǎng)絡(luò)層數(shù)加深,更加有效率的專用芯片對(duì)于布局人工智能的科技企業(yè)將會(huì)愈發(fā)重要。
  【安防展覽網(wǎng) 視點(diǎn)跟蹤】8月23日,華為宣布其自研的AI 芯片——Ascend 910(昇騰910)正式上市商用,與之一同發(fā)布的還有的新一代AI開(kāi)源計(jì)算框架 MindSpore ,全面對(duì)標(biāo)谷歌TensorFlow和FaceBook的PyTorch,并計(jì)劃2020年季度全面開(kāi)源開(kāi)放。
 
8月23日,華為公司輪值董事長(zhǎng)徐直軍出席AI處理器Ascend 910及全場(chǎng)景AI計(jì)算框架MindSpore發(fā)布會(huì)
 
  據(jù)華為副董事長(zhǎng)、輪值董事長(zhǎng)徐直軍介紹,昇騰910與MindSpore配合,相比現(xiàn)有主流訓(xùn)練單卡配合TensorFlow的組合顯示出接近2倍的性能提升。在去年十月,公布技術(shù)參數(shù)時(shí),徐直軍就曾表示昇騰910是業(yè)界算力高的AI處理器,相同功耗情況下,它的算力是業(yè)界強(qiáng)AI芯片的2倍,強(qiáng)CPU的50倍??梢钥闯?,Ascend910的實(shí)力強(qiáng)勁,傲視業(yè)界AI芯片的同時(shí)竟然高出同期CPU計(jì)算能力數(shù)十倍。那么常規(guī)印象中被認(rèn)為是計(jì)算機(jī)的“大腦”的CPU,性能強(qiáng)的核心單元,現(xiàn)在只能用來(lái)襯托AI芯片的性能了嗎?
 
  其實(shí)不然,就目前情況,通用大規(guī)模集成電路的類型主要有CPU、DSP、GPU、FPGA幾種:
 
  CPU
 
  一般來(lái)說(shuō)CPU運(yùn)算能力弱,雖然主頻高,但是單顆核心數(shù)量也有8核、16核,按單核3.5G主頻計(jì)算,16核即就是56G的主頻;再考慮指令周期,每秒多執(zhí)行30G次乘法。
 
  DSP
 
  DSP雖然主頻不如CPU, 但是勝在乘法器多,動(dòng)輒附帶16個(gè)乘法器,而且是浮點(diǎn)的。再者,不論4核、8核,它還具有特定的算法硬件加速,所以雖然主頻只有1-2G,但是運(yùn)算能力還是比CPU強(qiáng)。當(dāng)然現(xiàn)在出現(xiàn)了帶專用乘法器的CPU,DSP也集成了ARM核,這兩者的界限開(kāi)始變得模糊。DSP所有計(jì)算均使用浮點(diǎn)算法,目前還沒(méi)有位或整數(shù)運(yùn)算指令。
 
  GPU
 
  GPU專為圖像處理設(shè)計(jì),主頻一般在500MHz左右,但是核芯數(shù)量多,比如英偉達(dá)Titan, 有380多個(gè)流處理單元,主頻和單元數(shù)相乘起來(lái):500*400就是200G的計(jì)算量,這個(gè)量級(jí),遠(yuǎn)大與于前面二者。
 
  FPGA
 
  FPGA的運(yùn)算能力的,拿的來(lái)說(shuō):3000多個(gè)固定乘法器,用片上資源靠數(shù)字邏輯還能再搭建3000個(gè),主頻快能到接近300MHz, 則總計(jì)算性能可達(dá)(3000+3000)*300M = 1800G這個(gè)量級(jí)。
 
  因此不難理解,這幾個(gè)類型的芯片適合的應(yīng)用場(chǎng)合不同:
 
  1.CPU雖然運(yùn)算不強(qiáng),但是擅長(zhǎng)進(jìn)行管理和調(diào)度,比如讀取數(shù)據(jù)、管理文件、處理人機(jī)交互等。
 
  2.DSP相較CPU而言管理變?nèi)趿?,運(yùn)算加強(qiáng)了。這兩者都是靠高主頻來(lái)解決運(yùn)算量的問(wèn)題,適合有大量遞歸操作以及不便拆分的算法。
 
  3.GPU管理方面更弱,運(yùn)算更強(qiáng),由于是多進(jìn)程并發(fā),更適合整塊數(shù)據(jù)進(jìn)行流處理的算法。
 
  4.FPGA能進(jìn)行管理也能運(yùn)算,但是開(kāi)發(fā)周期很長(zhǎng),復(fù)雜算法開(kāi)發(fā)難度大。適合流處理算法,不管是整塊數(shù)據(jù)進(jìn)還是一個(gè)一個(gè)進(jìn)。還有就實(shí)時(shí)性來(lái)說(shuō),F(xiàn)PGA是高的。前三種處理器為了避免將運(yùn)算能力浪費(fèi)在數(shù)據(jù)搬運(yùn)上,一般要求累計(jì)一定量數(shù)據(jù)后才開(kāi)始計(jì)算,因此產(chǎn)生群延時(shí),而FPGA所有操作都并行,因此群延時(shí)可以很小。
 
  了解了以上類型的芯片之后,就不難分析AI芯片如何得以超越CPU計(jì)算性能如此多倍。所謂AI芯片,一般是指為了進(jìn)行人工智能相關(guān)的運(yùn)算而進(jìn)行有針對(duì)的優(yōu)化過(guò)的專用芯片(ASIC芯片)。
 
  例如,人工智能領(lǐng)域發(fā)展火熱的自動(dòng)駕駛,需要識(shí)別道路、行人、交通燈等狀況, 如果使用CPU去進(jìn)行計(jì)算,那么極有可能出交通事故。前面已經(jīng)提到過(guò),CPU擅長(zhǎng)控制,并且其設(shè)計(jì)決定了在工作時(shí)為了減小數(shù)據(jù)傳輸對(duì)運(yùn)算力的浪費(fèi),需要累積到一定數(shù)據(jù)量才進(jìn)行計(jì)算,而這根本無(wú)法滿足自動(dòng)駕駛情景所需要的強(qiáng)實(shí)時(shí)性。而如果使用GPU計(jì)算,在承擔(dān)高功耗的同時(shí)只能利用起其中部分的計(jì)算資源,不論是在云端還是終端,都不是一個(gè)具有良好能耗比的選擇。而且,GPU不但能耗比低,其價(jià)格也一直高居不下,且供應(yīng)不穩(wěn)定;所以通用型芯片在進(jìn)行人工智能相關(guān)計(jì)算時(shí)的功耗、效率、價(jià)格等因素一起促成了人工智能專用芯片的開(kāi)發(fā)和商用。
 
  目前,AI的應(yīng)用并未在自動(dòng)駕駛領(lǐng)域過(guò)多展開(kāi),主要還是集中在圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域。這些領(lǐng)域內(nèi)的算法本質(zhì)上來(lái)說(shuō)都是矩陣或向量的加、乘運(yùn)算。目前先進(jìn)的服務(wù)器CPU之一,IBM POWER8(目前該系列已有POWER9,性能提升1.5倍),擁有4G主頻,128位位寬。假設(shè)處理8個(gè)16位的數(shù)據(jù),一個(gè)周期多執(zhí)行8個(gè)乘/加計(jì)算。理論上一次多執(zhí)行16個(gè)操作,那么此CPU理論每秒計(jì)算次數(shù)是:16*64Gops=64Gops。
 
  再看谷歌的人工智能專用張量計(jì)算芯片TPU1.0(目前已到TPU3.0),主頻只有700MHz,然而擁有64,000個(gè)乘/加單元,單詞多執(zhí)行64,000*2=128K次計(jì)算,因此其理論計(jì)算次數(shù)位:128K*700M=89,600Gops,約90Tops,非常高數(shù)量級(jí)的計(jì)算量。目前我們所看到的端側(cè)人工智能芯片算力多在10T內(nèi),是因?yàn)槎藗?cè)人臉識(shí)別等人工智能應(yīng)用要求算力的同時(shí)也需要保持低功耗,所以不會(huì)出現(xiàn)如此夸張的數(shù)值。但通過(guò)計(jì)算對(duì)比,足以看出在人工智能計(jì)算方面專用芯片和通用芯片的效率差距。
 
谷歌TPU內(nèi)部結(jié)構(gòu)圖
 
  總結(jié)而言,CPU與GPU并不是AI專用芯片,為了實(shí)現(xiàn)其他功能,內(nèi)部有大量其他邏輯,而這些邏輯對(duì)于目前的AI算法來(lái)說(shuō)是無(wú)用武之地的,所以,導(dǎo)致CPU與GPU不能成為優(yōu)的性價(jià)比之選;而FPGA更是因?yàn)閮r(jià)格高,開(kāi)發(fā)周期長(zhǎng),而多被用于設(shè)計(jì)開(kāi)發(fā)的前期驗(yàn)證步驟。因此,隨著人工智能需求發(fā)展,神經(jīng)網(wǎng)絡(luò)層數(shù)加深,更加有效率的專用芯片對(duì)于布局人工智能的科技企業(yè)將會(huì)愈發(fā)重要。華為此次發(fā)布的昇騰910芯片屬于Ascend-max系列,其技術(shù)規(guī)格在HC2018大會(huì)上已經(jīng)公布:半精度(FP16)算力達(dá)256T-Flops,整數(shù)精度(INT8)算力達(dá)到512T-ops,功耗310W?,F(xiàn)在,昇騰910已經(jīng)被用于實(shí)際的AI訓(xùn)練任務(wù),比如ResNet50神經(jīng)網(wǎng)絡(luò)等。同時(shí),華為表示將繼續(xù)投入,推出更多AI處理器,面向全場(chǎng)景持續(xù)提供更充裕、更經(jīng)濟(jì)、更適配的AI算力。雖然人工智能目前還處于初級(jí)發(fā)展階段,但隨著其發(fā)展領(lǐng)域橫軸的拓寬,縱向應(yīng)用的加深,相信在不久的將來(lái),我們會(huì)看到更多、專注的人工智能專用芯片的出現(xiàn)。(原標(biāo)題:為什么要做AI芯片)
關(guān)鍵詞 集成電路AI芯片性價(jià)比
相關(guān)閱讀更多
版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明“來(lái)源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來(lái)源:智慧城市網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它來(lái)源(非智慧城市網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)或和對(duì)其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí),必須保留本網(wǎng)注明的作品第一來(lái)源,并自負(fù)版權(quán)等法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問(wèn)題,請(qǐng)?jiān)谧髌钒l(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

正在閱讀:各大企業(yè)為何競(jìng)逐人工智能芯片?
我要投稿
  • 投稿請(qǐng)發(fā)送郵件至:(郵件標(biāo)題請(qǐng)備注“投稿”)afzhan@foxmail.com
  • 聯(lián)系電話0571-87756384
智慧城市行業(yè)“互聯(lián)網(wǎng)+”服務(wù)平臺(tái)
智慧城市網(wǎng)APP

功能豐富 實(shí)時(shí)交流

智慧城市網(wǎng)小程序

訂閱獲取更多服務(wù)

微信公眾號(hào)

關(guān)注我們

抖音

智慧城市網(wǎng)

抖音號(hào):afzhan

打開(kāi)抖音 搜索頁(yè)掃一掃
i

視頻號(hào)

AF智慧城市網(wǎng)

視頻號(hào)ID:sphF7DOyrojJnp8

打開(kāi)微信掃碼關(guān)注視頻號(hào)

小紅書(shū)

智慧城市

小紅書(shū)ID:2537047074

打開(kāi)小紅書(shū) 掃一掃關(guān)注
反饋