-
2017年中國AI 高速發展現狀及未來應用發展趨勢
2017/4/26 10:38:18 來源:中國產業發展研究網 【字體:大 中 小】【收藏本頁】【打印】【關閉】
核心提示:一、AI 高速發展架設智能汽車發展橋梁當前,隨著互聯網、大數據、云計算等信息技術的快速發展,以深度學習為基礎的 人工智能在機器人、智能汽車、智能家居等領域的應用日益廣泛和深入,正逐漸成為新 一輪信息技術革命的核心。人工智能與無人駕駛、車一、AI 高速發展架設智能汽車發展橋梁
當前,隨著互聯網、大數據、云計算等信息技術的快速發展,以深度學習為基礎的 人工智能在機器人、智能汽車、智能家居等領域的應用日益廣泛和深入,正逐漸成為新 一輪信息技術革命的核心。人工智能與無人駕駛、車聯網的緊密結合,將對汽車領域產 生重大變革,而傳統汽車廠商為此積極開展戰略布局。
智能汽車發展路徑圖
數據來源:公開資料整理
汽車巨頭加快人工智能領域布局的推動因素:
三大主要推動因素
數據來源:公開資料整理
下一階段發展趨勢分析
數據來源:公開資料整理
國內智能汽車產業鏈條上廠商應開展以下布局
下一階段發展趨勢分析
數據來源:公開資料整理
1、注重傳感與控制等基礎技術研發,通過軟硬件系統集成、云端互聯和大數據分析, 加快推動車聯網和安全駕駛等成熟應用。加強新一代信息技術研發投入,將深度學習、 大數據、云計算等作為重要突破口,注重信息技術與傳統應用領域的融合創新,前瞻布 局人工智能、無人駕駛等新興市場。
2、充分發揮制造企業和信息技術企業各自優勢,圍繞云計算、大數據、車聯網等關 鍵技術,積極搭建深度學習平臺,加強信息資源共享與協同研發。通過加大對人工智能、 無人駕駛領域初創企業的投資收購,或與互聯網企業開展跨界合作,實現人工智能、無 人駕駛等領域優勢資源的深度整合。
3、深挖行業市場需求,針對語音識別、圖像識別、手勢識別等技術開展應用創新, 促進人車交互方式的多元化和智能化發展。加強人工智能與車聯網技術融合創新應用, 利用 V2V、V2I、V2P 等技術實現車輛、基礎設施、行人之間的感知互聯,通過大數據分 析、云端共享提升安全駕駛水平。
二、AI 硬件持續升級,帶來產業革命新機遇
1、GPU 靈魂領軍者英偉達
讓車擁有能力,得以看見,得以思考,得以學習。NVIDIA 為汽車制造商,一級汽車 制造供應商,汽車研究機構和初創企業提供其智能駕駛產品所需,使他們可以通過 AI 系 統來靈活的開發和部署自動駕駛技術。其涉足于汽車行業,為寶馬、奧迪等品牌提供車 內信息娛樂系統的顯示芯片以及主動駕駛員輔助安全系統的圖像處理芯片。
NVIDIA 一致性的人工智能運算架構使訓練深度神經網絡技術在 NVIDIA DGX-1™數據 中心得到應用,使它們與 NVIDIA DRIVE PX2 在車內無縫結合。這種端到端的方法利用 NVIDIA DriveWorks 軟件的調節作用,能夠讓汽車通過 OTA 的方式進行更新,從而使整 個車輛在整車周期之內不斷完善特性和功能。
DRIVE™PX2——自動駕駛汽車的人工智能車輛計算機
NVIDIA®DRIVE™PX2 是開放式人工智能車輛計算平臺,可以讓汽車制造商和一級汽車 制造供應商加速產品的自主化和無人駕駛車輛的研發。這是一個可以從手掌大小并能力 充足的模塊,擴展到一個可實現自動駕駛的強大的人工智能超級計算機。
DRIVE™PX2
數據來源:公開資料整理
三、FPGA
近年來不斷增長的數據量和訪問入口改變著人工智能的算法設計的理念——人工建 立算法的做法被自動學習能力的建立所取代,深度學習是其中一項重要技術和推動力。 然而,深度學習模型的數據處理和計算能力的不斷升級需要更好的硬件加速條件,其發 展依然面臨著計算性能和功耗的雙重挑戰。現場可編程門陣列(FPGA)提供了一種解 決方案。
1、 FPGA的基本原理
FPGA 全稱“可編輯門陣列(Field Programmable Gate Array)”,其基本原理是在芯 片內集成大量的數字電路基本門電路以及存儲器,用戶可以通過燒入配置文件來定義這 些門電路以及存儲器之間的連線。不過,這種燒入不是一次性的,因此使得 FPGA 可以 快速實現為機器學習算法開發的處理器架構,開發的風險小且成本較低。
FPGA架構圖
數據來源:公開資料整理
每個 FPGA 主要由三個部分組成:
輸入輸出邏輯,主要用于 FPGA 與外部其他部件,比如傳感器的通信;
計算邏輯部件,主要用于建造計算模塊;
可編程連接網絡,主要用于連接不同的計算邏輯部件去組成一個計算器。
FPGA 通常把算法的數據流以及執行指令寫死在硬件邏輯中,從而避免了 CPU 的 Instruction Fetch 與 Instruction Decode 工作。
2、FPGA的特性
與其他計算載體如 CPU與 GPU相比,FPGA 具有高性能、低能耗以及可硬件編程 三大特點。
高性能
雖然 FPGA 的頻率一般比 CPU 低,但可以實現并行度很大的硬件計算器。比如一 般 CPU每次只能處理4 到 8 個指令,在 FPGA上使用數據并行的方法可以每次處理256 個或者更多的指令,處理的數據量遠遠增加。另外,在 FPGA 中一般不需要 Instruction Fetch 與 Instruction Decode,也節省了不少計算時間。
FPGA、CPU、GPU 執行 GaxPy 算法每次迭代時間(單位:微秒)
數據來源:公開資料整理
低能耗
FPGA 相對于 CPU與 GPU 有明顯的能耗優勢,主要有兩個原因:
1) 在 FPGA 中沒有 Instruction Fetch 與 Instruction Decode;
2) FPGA 的主頻比 CPU與 GPU低很多,通常 CPU與 GPU 都在 1GHz 到 3GHz 之間,而 FPGA 的主頻一般在 500MHz 以下。
FPGA、CPU、GPU 執行 GaxPy 算法每次迭代能耗(單位:毫焦)
數據來源:公開資料整理
可硬件編程
FPGA 是可硬件編程的,相對于 ASIC 而言,可以對硬件邏輯進行迭代更新。
但是把算法寫到 FPGA 硬件并不是一個容易的過程,相比在 CPU與 GPU上編程技 術門檻高許多,因此其開發周期也會長很多。
傳統 FPGA 開發流程與 C-to-FPGA開發流程
數據來源:公開資料整理
在傳統的 FPGA 開發流程中,我們需要把 C/C++寫成的算法逐行翻譯成基于 Verilog 的硬件語言,然后再編譯 Verilog,把邏輯寫入硬件。而在 C-to-FPGA 開發流程中,我 們可以在C\C++的代碼中加Pragma, 指出哪個計算Kernel應該被加速,然后C-to-FPGA 引擎會自動把代碼編譯成硬件。經驗上看,使用傳統開發流程,完成一個項目大約需要 半年時間,而使用 C-to-FPGA 開發流程后,一個項目大約兩周便可完成,效率提升了 10 倍以上。
3、FPGA發展歷程
FPGA深度學習研究里程碑
數據來源:公開資料整理
FPGA近年來熱點應
數據來源:公開資料整理
FPGA 未來應用發展向好。FPGA 相對于 CPU 和 GPU,既能提供集成電路的性能 優勢,又具備可重新配置的靈活性,在進行感知處理等簡單重復的任務的時候的優勢很 明顯,很適合用于傳感器的數據預處理工作。按照現在的趨勢發展下去,FPGA 會在機 器人開發中對 GPU形成一定的沖擊。
三、AI 軟件加速發展,人機交互更添動力
人工智能應用還處于發展前期,從產業鏈投資角度看,基礎層和技術層布局需要投 入較多,周期較長,主要是由 IBM、微軟、NVIDIA、Intel 等巨頭把持,并以外延內生加 大版圖形成產業鏈生態,產業應用層上,初創公司在垂直領域解決行業痛點為較好切入 點。
語音識別前景可觀
語音識別隨著各種智能設備,包括智能可穿戴、智能家居、智能汽車等等都逐漸引 進交互功能,其前景變得越來越有想象空間。
語音識別技術成熟周期:
1)技術萌芽期(technology trigger)
2)期望膨脹期(Peak of Inflated Expectations)
3)泡沫化的谷底期 (Through of Disillusionment)
4)穩步爬升的光明期 (Slope of Enlightement)
5)實質生產的高峰期 (Plateau of Productivity)。
語音識別成熟階段圖
語音的研究的第一階段是 1952 年貝爾研究所 Davis 等人研究成功了世界上第一個 能識別 10 個英文數字發音的實驗系統。在此后的幾十年間進展緩慢,技術水平、 計算能力和應用場景,都不成熟。由于場景的局限性,語音技術在 PC 互聯網時代 并未大幅普及。
主要應用在一些垂直領域例如呼叫中心、教育、電信和金融等行業。
語音研究的第二、三階段的標志性事件可以看作 Siri 的面世。
語音研究的第四、五階段是今天的語音識別發展。隨著Amazon Echo、Google Home、 百度度秘、Siri 以及訊飛輸入法的普及,通過語音與機器交互很快就會成為主流。
事實上,語音技術之前是基于規則,識別率做到 90%要再提高一個百分點就非常困 難。提高的基礎是深度學習技術,即基于機器學習對海量語音進行大量統計再不斷改進 算法,讓語音識別乃至語義理解有了質變,準確率、抗噪力以及口音容錯性大幅提升, 并且且支持更多方言,讓整體翻譯變得更加容易——即基礎模型不變,只需面向不同語 言進行對應領域的算法優化即可。
智能駕駛區別于其他應用領域的區別在于,其語音識別在駕駛過程中屬于必需品。 及在智能家居整合語音識別進行的交互中,用戶可以通過鍵盤輸入指令的方式替代,但 是在駕駛過程中,駕駛者(法律上)無法進行(不應該騰手)進行其他操作的,因此語 音識別可以看作是智能駕駛的必要場景。
智能汽車語音場景所面臨的挑戰
噪音、回聲的干擾
大量的數據作支撐建立起語音識別模型,需要不斷完善口音數據的包容性
語音識別實際上是一項工具型技術。未來的語音識別將會落腳在借助語音識別的車 聯網應用服務上,比方說 LBS 的語音搜索,語音電臺等。
語音產品各大公司一覽 代
數據來源:公開資料整理
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如有侵權行為,請第一時間聯系我們修改或刪除,郵箱:cidr@chinaidr.com。