手機版 | 網(wǎng)站導航
觀察家網(wǎng) 行業(yè) >

人工智能芯片能做什么? 可根據(jù)AI需求成像

科技日報 | 2019-08-05 14:48:49

一片小小的人工智能視覺芯片能做什么?無人駕駛汽車主動識別并避讓行人、攝像頭實時甄別在逃犯……這些影視作品中的情節(jié),或許不久將可通過基于嵌入式人工智能視覺芯片的“解決方案”成為現(xiàn)實。

人工智能芯片被視為未來人工智能時代的戰(zhàn)略制高點。在視覺感知領(lǐng)域,人工智能視覺芯片正逐步應(yīng)用于智能手機、安防監(jiān)控、自動駕駛、醫(yī)療成像和智能制造等領(lǐng)域。

可根據(jù)AI需求成像

縱觀信息產(chǎn)業(yè)發(fā)展歷程,從個人電腦時代到移動互聯(lián)網(wǎng)時代,承載高性能計算的芯片決定新型計算平臺的基礎(chǔ)架構(gòu)和發(fā)展生態(tài),并掌握著產(chǎn)業(yè)鏈最核心的話語權(quán)。

中國科學院院士張鈸指出,傳統(tǒng)硬件架構(gòu)難以滿足人工智能時代深度學習的要求,新的算法需要新的硬件來支撐。同時,芯片的結(jié)構(gòu)將越來越像“大腦”,類腦芯片、智能芯片等將是人工智能的發(fā)展方向。

“所謂視覺芯片,實際上是一種具有高速圖像采集和實時圖像處理功能的片上集成系統(tǒng)芯片。”中國科學院半導體研究所半導體超晶格國家重點實驗室研究員吳南健介紹說,在日前舉辦的國家自然科學基金優(yōu)秀成果北京對接會上,吳南健帶領(lǐng)研究團隊展示的新型視覺芯片(Vision Chip)科研成果很是引人注目。

據(jù)介紹,這種視覺芯片集成高速圖像傳感器和大規(guī)模并行圖像處理電路,能夠模仿人類視覺系統(tǒng)視覺信息并行處理機制,解決現(xiàn)有視覺圖像系統(tǒng)中數(shù)據(jù)串行傳輸和串行處理的速度限制瓶頸問題。

吳南健解釋說,人工視覺的架構(gòu)分兩部分,類似于人的眼睛和大腦。人的眼睛是一個典型的圖像傳感器,能夠攝取圖像并且進行一些噪音去除等初級圖像處理;人的大腦神經(jīng)元網(wǎng)絡(luò)是一個視覺圖像處理系統(tǒng),具有非常強的對所攝取的視覺信息進行并行處理的能力。

AI視覺芯片與攝像頭的關(guān)系是——芯片做的是大腦,攝像頭做的是眼睛。這里就存在一個問題:大腦該如何控制眼睛?遠望智庫人工智能事業(yè)部部長、圖靈機器人首席戰(zhàn)略官譚茗洲解釋道,傳統(tǒng)的技術(shù)方法是定義一個通信控制接口,但在視覺應(yīng)用中這種做法會非常復雜。人眼的成像是非常聚焦的,只看到關(guān)注的東西。當AI算法解決了“要看什么”的問題后,前端成像就有了目標,可以把所有的資源都調(diào)配到關(guān)注的對象上,做到“指哪打哪”,也就是取出噪音的處理過程,可以更高效智能地處理視覺信息。這種根據(jù)AI的需求來成像,能解決很多以前解決不了的問題。

“通常以前處理的方式,是通過攝像頭把信息攝錄,傳到服務(wù)器或云端后,利用服務(wù)器上的顯卡進行運算,現(xiàn)在是將視覺芯片嵌入攝像頭,讓其本身可以處理信息,做成專用芯片,如果芯片大批量生產(chǎn),在價格上會便宜非常多,極大降低成本。這就是目前這項技術(shù)突破的核心價值。”譚茗洲在接受科技日報記者采訪時指出。

比人類視覺更具優(yōu)勢

在我們通常的印象中,一個視力正常的人可以迅速且毫不費力地感知世界,甚至可以詳細生動地感知整個視覺場景;但其實這只是一個錯覺。

“人類生理視覺有著天然的局限,只有投射到眼球中心視覺場景的中間部分,我們才能看清楚。比起人眼來,嵌入視覺芯片的機器將具備相當多的優(yōu)勢,因為可以傳感更寬的頻譜范圍、更高的清晰度、更寬的視角,其視力遠不止5.0,在夜間也可以看得很清楚。如同AlphaGo戰(zhàn)勝‘圍棋天才’一樣,在某些應(yīng)用場景,其視覺在準確性、客觀性、穩(wěn)定性等方面都要比人類視覺更具優(yōu)勢。”譚茗洲指出。

吳南健介紹說,目前,國內(nèi)外在人工視覺芯片領(lǐng)域的研究主要是CMOS圖像傳感器芯片技術(shù)、并行圖像處理技術(shù)和CMOS集成技術(shù)。在CMOS圖像傳感器領(lǐng)域,國際技術(shù)水平朝著高分辨率、寬動態(tài)范圍、高幀率、高智能化、寬波長范圍和三維成像的方向發(fā)展。人工視覺系統(tǒng)芯片能夠完成圖像獲取和初級(圖像濾波)、中級(特征提取)、高級(特征識別和不規(guī)則處理)3個圖像處理步驟。

“視覺芯片關(guān)鍵要解決運行效率和處理3D影像這兩個問題。以往視覺芯片處理信號面臨的最大問題是因運算量太大導致處理信息速度低,以及攝取的照片是把三維世界‘壓縮’成二維影像,在一張平面上已分不清物體距離遠近、立體空間形狀、空間位置等,而人眼可把這個還原。”譚茗洲表示。

記者了解到,新型人工智能視覺系統(tǒng)芯片,是將高速CMOS圖像傳感器、并行信號處理單元和輸出電路集成于單一芯片內(nèi),實現(xiàn)實時視覺芯片系統(tǒng)。將不同功能的技術(shù)集成在一個芯片上有很多優(yōu)勢,實現(xiàn)圖像獲取和圖像信息處理每秒一千幀的系統(tǒng)速度,可廣泛應(yīng)用于高速圖像處理、快速圖像識別解釋、高速運動目標的實時追蹤等領(lǐng)域。

譚茗洲指出:“目前,中科院設(shè)計的新型視覺系統(tǒng)芯片理念非常先進,仿照人類視網(wǎng)膜神經(jīng)元機制設(shè)計,感光對信號的處理方式,揀取有用的信號進行處理,極大地減少了運算的體量。”

未來市場空間巨大

“以我個人的觀點,視覺系統(tǒng)芯片會成為必然的趨勢,就像手機和相機結(jié)合成就智能手機一樣,目前在技術(shù)上已突破填充率低、分辨率低和信號干擾嚴重的難題,將科研成果轉(zhuǎn)化并投放市場只不過是時間問題。”吳南健表示。

記者了解到,目前基于該技術(shù)的產(chǎn)成品已經(jīng)試用于一些創(chuàng)新企業(yè),比如在工業(yè)產(chǎn)品的自動化檢測領(lǐng)域完全可以使用視覺系統(tǒng)芯片代替人工檢測;在智能監(jiān)控領(lǐng)域,過去需要將視覺處理芯片裝在具有傳感器技術(shù)的攝像頭上,通過把數(shù)據(jù)結(jié)構(gòu)化、再壓縮送到數(shù)據(jù)中心的復雜方式完成數(shù)據(jù)傳輸和計算。

那么,視覺系統(tǒng)芯片如果在未來實現(xiàn)產(chǎn)業(yè)化,其市場空間有多大?據(jù)推算,2018年,圖像傳感器的市場規(guī)模在150億美元左右,雖然其中120億美元發(fā)生在智能手機領(lǐng)域,但未來發(fā)展比較快的4個領(lǐng)域是安防、國防、汽車、醫(yī)療,到2021年將會迎來40億美元的市場空間,年增長率約10%—20%。

“視覺處理器的需求增長會更快,目前該市場的整體規(guī)模(包括硬件、軟件、服務(wù))在170億美元至180億美元,單從硬件來看也占到約30億美元。如果視覺系統(tǒng)芯片可以覆蓋70億美元的市場規(guī)模,企業(yè)在這中間拿到1%的話,其盈利空間就已經(jīng)很大了。”吳南健指出。

近年來,國內(nèi)外一批新型人工智能企業(yè),依托人工智能領(lǐng)域技術(shù)和算法優(yōu)勢向芯片行業(yè)滲透,加強人工智能芯片基礎(chǔ)層研發(fā)。從市場格局來看,已經(jīng)發(fā)展成為一個相對獨立又相互依存的產(chǎn)業(yè)生態(tài)。在前端,索尼是圖像傳感器市場、生產(chǎn)和技術(shù)的領(lǐng)導者,緊隨其后的三星和豪威科技也保持著不錯的競爭力;在后端,Mobileye和英偉達(NVIDIA)是提供視覺處理芯片的主要廠商,在國內(nèi)該領(lǐng)域的公司有地平線等。

然而,截至目前,尚未有企業(yè)實現(xiàn)“圖像傳感器+視覺處理器”集成式芯片的大規(guī)模量產(chǎn)。不管是現(xiàn)在的創(chuàng)業(yè)企業(yè),還是已經(jīng)在市場上占有一定份額的大企業(yè),不是做圖像傳感器,就是做后端的視覺處理器。正如吳南健所言,這將給初創(chuàng)企業(yè)帶來機會。

  • 標簽:AI成像,人工智能芯片

相關(guān)推薦

媒體焦點