【
智慧城市網(wǎng) 品牌專欄】PaddleSpatial是基于百度飛槳深度學習框架開發(fā)的時空大數(shù)據(jù)計算工具和平臺,融合了百度領先的區(qū)域分割、時間序列、城市遷移學習等時空數(shù)據(jù)處理能力。本次將由百度研究院資深研究員、PaddleSpatial技術負責人周景博,為大家分享PaddleSpatial如何實現(xiàn)深度學習與時空大數(shù)據(jù)的結(jié)合,以助力智慧城市發(fā)展。

一、百度大數(shù)據(jù)和人工智能技術助力智慧城市建設
首先講一下我們項目研發(fā)的方法論。我們可以用一個三角形來表示大數(shù)據(jù)、人工智能和智慧城市之間的關系。百度的大數(shù)據(jù)的優(yōu)勢體現(xiàn)在多個方面,正是這些海量的動態(tài)時空大數(shù)據(jù)和互聯(lián)網(wǎng)大數(shù)據(jù),實現(xiàn)了城市的數(shù)字化,讓我們更快更直接地感受城市的變化規(guī)律。這為更好地建設智慧城市提供了必要的數(shù)據(jù)基礎。同時,大數(shù)據(jù)也為人工智能提供了燃料,對訓練機器模型是不可少的。這樣大數(shù)據(jù)和人工智能共同為智慧城市的建設,提供了必要的數(shù)據(jù)和技術支撐。
二、PaddleSpatial開源算法介紹
PaddleSpatial的研發(fā)目的正是為了充分利用百度的時空大數(shù)據(jù)能力和人工智能技術,構(gòu)建基礎算法的開源工具,來支撐上層城市的應用。
目前PaddleSpatial開源的主要算法模塊包括區(qū)域切分,社區(qū)屬性預測,空間圖神經(jīng)網(wǎng)絡,城市遷移學習和城市時間序列數(shù)據(jù)預測等等。同時我們在上層研發(fā)了一些相關的城市計算的應用,包括區(qū)域畫像,出行畫像,城市量化分析,智能交通等等。下面我將一一做簡要的分享。
首先我們先介紹一下PaddleSpatial里有亮點的幾個算法模塊。
第一,是支持空間點的關系預測的空間圖神經(jīng)網(wǎng)絡模型。圖神經(jīng)網(wǎng)絡近兩年取得了非常大的進展,但是存在一個問題是,它通常將圖當成一個拓撲圖來處理,建模的是結(jié)點和結(jié)點之間的關系。實際上在地理數(shù)據(jù)中,點和點的相對位置和角度是非常重要的。如何建模兩點之間的距離及角度,是目前圖神經(jīng)網(wǎng)絡不能很好處理的問題。因此我們提出一個空間自適應的圖神經(jīng)網(wǎng)絡算法。它把地理空間中兩點之間的相對距離和角度信息,很好整合到圖神經(jīng)網(wǎng)絡框架中。
第二個功能是城市區(qū)域切分。它主要是基于路網(wǎng)數(shù)據(jù),將城市切分成細分單元,進而將這個基礎單元作為研究對象。城市區(qū)域切分和自然語言處理中的應用相對比,實際上是定義了城市空間域上的“切詞”能力。和已有的算法做對比可以看出,PaddleSpatial開源的城市區(qū)域切分方法的準確率遠高于已有的方法。PaddleSpatial可以將全國劃分成150萬個區(qū)塊,為進一步的城市研究提供了堅實的基礎。
完成城市區(qū)域切分之后,下一步就是研究城市區(qū)域的各類屬性,比如人口數(shù)量,房價,以及人群分布等。這里我們也研發(fā)了一個城市區(qū)域稀疏標簽預測算法。城市區(qū)域稀疏標簽的一個典型的應用是城中村檢測。城中村在很多城市都存在,但是數(shù)量是非常稀疏的。通過我們研究的算法,可以實現(xiàn)對整個城市城中村的檢測。初步的實驗結(jié)果也證明我們的方法顯著優(yōu)于現(xiàn)有的最好方法。
在建模區(qū)塊之后,還會研究區(qū)塊間的人流關系,比如說不同的區(qū)塊之間流量是多少。我們也專門提出了面向城市區(qū)域之間的流量預測模型。該模型的創(chuàng)新點包括變分的有向圖自編碼器,城市多模態(tài)信息融合的先驗分布對齊以及基于泊松分布的解碼器等。在已有的區(qū)域流量數(shù)據(jù)上,取得了非常好的效果。
三、城市認知計算在智慧城市的應用
前面我著重分享了PaddleSpatial的特色算法工具,后面我會再側(cè)重介紹一下我們實驗室正在進行的城市認知計算相關的項目。我們的目標是構(gòu)建城市空間的認知計算能力,進而能更好地理解城市,造福城市居民。
我們首先介紹的是區(qū)域畫像。區(qū)域畫像包括人群畫像、生活地圖、常訪區(qū)域、區(qū)域指數(shù)、用地分布、功能分布等特色功能。區(qū)域畫像具有更細粒度的分析力和辨識能力,可以動態(tài)感知區(qū)域間人流分布和人流特征,并進行城市功能區(qū)的實時分析。區(qū)域畫像的覆蓋范圍非常精細,可以支持省到街道的5級空間維度的縮放,相關數(shù)據(jù)可以支持覆蓋全國的用戶特征和功能設施分析。
同時,和區(qū)域畫像相關聯(lián),我們還建立了城市的出行畫像。與區(qū)域畫像不通,出行畫像以每個出發(fā)地和目的地構(gòu)成OD 對為基本研究單位,細粒度刻畫人群的移動屬性。通過海量歷史人群數(shù)據(jù),進行量化的指標分析和預測能力建模,提升城市的感知能力。
這里是我們構(gòu)建的區(qū)域畫像和出行畫像的系統(tǒng)。首先來看出行畫像,對于每一個出發(fā)地和目的地構(gòu)成的OD 對,我們可以是實現(xiàn)細粒度的人群分析,展示在同一路徑上的不同的人群的流量、交通方式等維度。區(qū)域畫像則可以實現(xiàn)對一個區(qū)域的人群和屬性的分析。我們可以建立每個區(qū)域的生活地圖,分析該區(qū)域衣食出行的需求和供給情況。我們還可以分析該區(qū)域的常訪地點,觀察不同層級的出發(fā)地和目的地等。然后,我們還構(gòu)建了細粒度的區(qū)域指數(shù),包括便民指數(shù)、生活品質(zhì)指數(shù)等。我們還可以對區(qū)域進行用地和功能分布的分析。用地分布體現(xiàn)了區(qū)域的規(guī)劃定位,比如居民用地和教育用地等;而功能分布則體現(xiàn)了該區(qū)域自發(fā)形成的服務功能,比如休閑娛樂和餐飲美食等功能。
我們還會進一步研究城市之間的關系,并學習城市的已知規(guī)律,將它應用到其他的城市上。在2020年疫情期間,我們實驗室和地圖合作完成了一個新冠肺炎感染高風險小區(qū)的識別項目。該項目結(jié)合多模態(tài)學習和城市區(qū)域遷移學習技術,設計了城市新冠肺炎感染高風險小區(qū)的識別算法。去年新冠疫情剛爆發(fā)的時候,只有武漢開始大規(guī)模流行。通過看武漢發(fā)生大規(guī)模疫情爆發(fā)的小區(qū)特點是什么樣的,來抽取出規(guī)律,進而指導其他城市。我們研發(fā)的模型可以定位新冠疫情高風險小區(qū)的成因,提示政府對不同區(qū)域采取針對性優(yōu)化措施,助力政府提高疫情管控能力。
PaddleSpatial構(gòu)建的平臺能力在與雄安新區(qū)管委會,聯(lián)合國開發(fā)署和北京市交研院的合作中都取得了示范性應用。其中我們完成雄安大數(shù)據(jù)報告被人民網(wǎng)、澎湃新聞、中新網(wǎng)、河北衛(wèi)視等50多家權威報道;同時我們還與新華社瞭望共建“中國幸福城市實驗室”,從2018年起持續(xù)為新華社主導的中國幸福城市排名提供技術支持,產(chǎn)生了廣泛的技術影響力。近期我們還將城立方的能力擴展到支持智能交通上,致力于讓城市交通運營商模式行健致遠,也取得了很好的效果。
我們設計了全國首個基于大數(shù)據(jù)和人工智能的城市幸福感指數(shù)框架。整個框架設計為9+X結(jié)構(gòu)。其中“9”指九大一級指數(shù),共包括100多個細分指標,力求覆蓋居民衣食住行的每一個維度和細分群體。比如,以“生活品質(zhì)”指數(shù)為例,它就覆蓋了“文體休閑水平、人均綠地占有度”等8個二級指標,每個二級指標進一步細分為更多三級指標。
去年,我們的指數(shù)框架還新增了一個X指數(shù),用于覆蓋每年的時事熱點,2020年的X指數(shù)是基于“新冠疫情”事件研發(fā)的“大數(shù)據(jù)抗疫指數(shù)”。相對于傳統(tǒng)的問卷調(diào)查和統(tǒng)計方法,百度城市幸福感指數(shù)具有科學性、創(chuàng)新性和全面性等優(yōu)勢。
PaddleSpatial的能力還可以協(xié)助我們進行城市發(fā)展趨勢的研判和分析,為城市管理者制定決策,提供數(shù)據(jù)和技術上的支持。近期我們支持了雄安、溫州等城市的城市大數(shù)據(jù)報告。特別是雄安的大數(shù)據(jù)報告,從2018年開始做,已經(jīng)連續(xù)做了第4期,產(chǎn)生了廣泛的媒體影響力。
四、在智能交通方面的探索
最后,我再簡單總結(jié)一下我們在智能交通上做的一些探索。我們今年上半年研發(fā)了業(yè)界領先的軌跡還原模塊。根據(jù)不同的十字路口拍攝的數(shù)據(jù),來復現(xiàn)車輛在城市上的完整軌跡。它作為百度交通大腦的亮點功能,上線到了保定和亦莊城市的交通大腦上。另外,結(jié)合已有的城市交通網(wǎng)絡和流量的預測,我們也和交管部門合作探索道路規(guī)劃和交通樞紐建設優(yōu)化的相關工作。
總之,我們希望持續(xù)的建設和優(yōu)化PaddleSpatial,實現(xiàn)用百度人工智能讓城市更智慧的遠景目標。謝謝大家的關注!