Path: EDNTaiwan電子技術設計 >> 設計中心 >> 電腦/週邊 >> 智慧架構將人工智慧導入行動設備
電腦/週邊 Share print

智慧架構將人工智慧導入行動設備

2015年08月25日  | Eran Briman

Share this page with your friends


作者:CEVA行銷副總裁Eran Briman


時下業界利用深度學習演算法來訓練細胞式類神經網路(CNN),以實現智慧化程度更高的行動設備,此舉可能需要全新的處理架構設計方法。然而,只要巧妙地充分利用現有技術,也可幫助我們進一步走向具備真正智慧認知能力的設備,以及完全重新定義用戶體驗。


在3月舉行的GPU技術大會上,Nvidia以汽車和先進駕駛輔助系統(ADAS)作為應用的焦點,配合Elon Musk的探討和評論,指出自動駕駛汽車的難題幾乎已完全解決。另一方面,隨著時間流逝,加上在降低功耗方面的調整與改良,筆者看到無處不在的3D感測、3D追蹤,以及視覺搜尋(visual search)等許多技術和應用正在快速地進入智慧手機,以及其他以電源或電池供電的嵌入式系統中。


結合用於偵測運動和音訊訊號的感測器、快速的記憶體存取以及高功效的資料處理方法,使得這些系統可以擁有真正的“認知”能力,甚至在不遠的將來構成一個用於人工智慧行動設備的平台。當前的要務是最佳化現有的架構來實現“智慧視覺(intelligent vision)”功能,比如3D深度圖和感知、物體辨識 以及擴增實境,還有一些核心的運算照相術(computational photography)功能,比如影像縮放、HDR、影像再對焦,以及微光下的影像增強。


隨著許多影像處理與增強功能也都使用電腦視覺技術,使得電腦視覺和影像處理技術之間的區別正變得越來越模糊。最直接的例子就是多幀影像增強功能,比如HDR、影像縮放與再對焦,通過拍攝多個連續的影像然後融合在一起,以得到更高品質的畫面。


雖然我們稱之為“影像增強”,但這其實牽涉到大量的電腦視覺處理來將影像“暫存?(register)”,其中涉及兩幀或三幀畫面之間的匹配。現在的用戶認為這是理所當然的基本功能,但其實它需要非常強大的處理能力,因此對於專門高性能數位訊號處理?(DSP)的需求只會有增無減。


高通(Qualcomm) 在Uplinq 2013上發表了一份論文,清楚地描繪了用於各種不同處理功能的像素功率和時間關係。該圖是以三個處理器為依據所繪製的,其中包括一個以1.2 GHz運行的單核CPU、一個四核CPU,以及一個以690 MHz運行的DSP。


對比不同處理器在處理每個像素時所需要的處理能力和時間,說明了DSP結合CPU用於視覺處理的優勢。為了最佳化功耗和性能,結合CPU、DSP和GPU可能是總體效果最好的方法
對比不同處理器在處理每個像素時所需要的處理能力和時間,說明了DSP結合CPU用於視覺處理的優勢。為了最佳化功耗和性能,結合CPU、DSP和GPU可能是總體效果最好的方法

上圖指出DSP僅在略超過CPU一半的時脈頻率下運作,便能夠在影像處理上達到相同效果,不但提供了性能增益的潛力,還節省了更多功耗(功率= 電容 x 電壓2?x 頻率,或者P=CV2xF)。


然而,隨著行動平台朝往實現類似人類的視覺、人工智慧和擴增實境應用的方向發展,我們可能需要重新思考所需要的處理架構,例如結合感測器融合和先進深度學習演算法(比如CNN),這些非常先進的計算密集型應用將提供具有更佳環境感知和情境感知的用戶體驗,但卻要以降低電池續航力作為代價。


設計人員一方面要實現具有智慧感知能力的設備,同時還要維持可接受的電池壽命,這是不容易克服的挑戰。有幾種方法可解決這個兩難的問題,例如使用來自高通或Nvidia的GPU來支援CPU,許多智慧手機都已經採取了這種作法。


持續降低功耗是不可妥協的需求,業界為此想到可利用針對視覺處理進行最佳化的DSP處理器來分擔特定的處理密集型功能。在處理物體辨識和跟蹤時,使用這種方法可以比當下最先進的GPU叢集節省高達九倍功耗。


然而,即使具備這種功耗等級,行動設備仍然不太可能在不久將來使用面部辨識來實現人群搜索(crowd searching),因為此功能對於處理能力的要求實在是太高了。不過,低功耗處理器和經過特定最佳化的處理器架構面世,已經為此帶來了希望,並已在這個領域取得實質進展。這樣的進展正是MIT Technology Review將深度學習稱為2013年十大技術突破之一的原因。除了在GTC上所進行的相關示範外,微軟、百度及Cognivue也都展示了一些研究成果。此後,這個領域還有許多長足的發展。


此外,澳洲業者Aziana最近宣佈與美國加州的BrainChip合併,後者是一家專門以硬體方式實現人工智慧的公司,現時著眼於為行動平台開發人工智慧的規劃。雖然支援強大處理能力的架構和超低功耗處理是十分重要的,但隨著雲端連接變得更普及和更快捷,我們應該盡可能地將處理工作(processing overhead)分配到雲端。


總歸一句話,那就是有智慧地分配工作(smart partitioning),把最適合雲端的工作分配給雲端處理,並把最適合行動設備的工作分配給行動設備處理,盡可能高效地依據架構分配功能,比如使用CPU來分配GPU和DSP之間的負載。根據高通公司的說法,就是使用合適的引擎來做合適的工作。





想要免費接收更多的技術設計資訊嗎?

馬上訂閱《電子技術設計》郵件速遞,透過郵箱輕鬆接收最新的設計理念和產品新聞。

為確保您的資訊安全,請輸入右方顯示的代碼.

啟動您的訂閱申請

我們已給您的註冊郵箱發送了確認信,請點擊信中的連結啟動您的訂閱申請。

這將有助於我們很好地保護您的個人隱私同時確保您能成功接收郵件。


添加新評論
遊客 (您目前以遊客身份發表,請 登入 | 註冊)
*驗證碼:

新聞 | 產品 | 設計實例