我們都有聽過 CPU,也有聽過 GPU,但最近有一個新的名詞,叫 VPU,你又有聽過嗎?
石先生第一次聽到這個名詞的時候,是因為 Google 與 Movidius 聯合發展深度學習等高科技內容。如果你查找維基百科,你會發現被收購前的 AMD 也曾經用過「VPU」一詞,但 AMD 與 Movidius 說的「VPU」乃兩件事情。AMD 說的「VPU」比較貼近我們現在說的 GPU,但 Movidius 說的 VPU 則完全不一樣。
圖像識別專門的處理器
這裡說的「VPU」乃 Movidius 對自家處理器的稱為,全稱為 Vision Processing Unit「視覺處理器」。它是一枚專注於處理影像分析的處理器,與 CPU 需要處理程序、GPU 處理影像輸出等不同。它的工作比較單一,就是圖像識別,可說是把 CPU 與 GPU 混合處理的工作獨立出來,成為一枚新核心。
這次 Google Project Tango 與 Movidius 合作的處理器名為「Myriad 2」(MA2450),屬於第二代的產品,由台積電 TSMC 利用 28 納米製程生產,擁有每秒 3 萬億次浮點運算能力,並能夠同時處理 6 個 60 frame Full HD 影像內容輸入,在純視覺處理方面可以輕鬆擊敗 Nvidia 的 Tegra,而且它的共享內存只有2MB,比很多處理器的都要小。
在圖像識別上,VPU 能夠做到追蹤動態物件、實物測距及深度學習環境,這三大功能算是補足了現時電腦缺乏或比較難做到的東西。
具備追蹤與繞行能力的無人機
VPU 的使用場景很多,例如他們最近也跟 DJI 合作,推出一款名為 Phantom 4 的無人機,此機通過 VPU 提供了偵測功能,協助 Phantom 4 擁有自行繞開障礙物的能力。
不過,Movidius 的 VPU 也不是完全沒有對手,例如 Intel 的 Real Sense 技術便以具備相同運算能力為目標,並在 Yunnec 無人機 Typhoon H 上實現了 360 度偵測、追蹤動態物件、自動繞行等功能,實現我們一直認為不太可能做到的無人機拍攝功能。
Tango 平板只是最基本的應用
對於 VPU 的理解,我們可以想像成電腦的眼睛,它給予電腦一種空間分析能力,特別適用於 3D 掃瞄、室內導航及 360 度全景拍攝等對影像要求較高的方式。
Google 與 Lenovo 合力推出的 Tango 平板裝置 – Phab2 Pro 乃一種基本應用場景,利用 VPU 等感應器構建出來的環境適用於室內設計、測量距離等過去無法即時計算出來的東西。
如果石先生做一個更豐富的想像,你可以想像未來室內設計或工程,我們無需看著紙上的圖則,拿著拉尺來量度,只要拿一台 Tango 平板便掃瞄便可得知所有的尺寸,並配合軟件安放傢俱等。
讓 AlphaGo 擁有眼睛會怎麼樣?
VPU 發展剛剛開始,無人機場景僅使用了小部份的功能,諸如 Google Tango 平板及 Microsoft Hololens 等擁有自由訂製能力的裝置剛推出開發版本,距離大範圍發揮與應用仍然有很大距離。
如果我們直線思考的話,現時正熱的 VR / AR 才能更好發揮 VPU 能力,利用運算能力豐富視覺體驗,但可以怎麼樣石先生一時也想像不到。
不過,若把它放在以 AlphaGo 作為代表的 AI 人工智能則完全不一樣。大家有留意 AlphaGo 比賽的話,都應該有注意到人類棋手下的棋則需要輸入到電腦裡,而 AlphaGo 在下棋的時候乃通過一助手觀看屏幕幫助下棋。
若把 VPU 加入 AlphaGo 的系統裡再配上一枚機械臂,那麼 AlphaGo 可以使用鏡頭配合 VPU 閱讀棋盤的佈局(黑白分辨好像還不行),把棋盤的情況直接提供予 AlphaGo 思考,然後利用機械臂放置棋子到棋盤,也就可以完全免卻助手,做到完全的機械人對人類。
對於 VPU 的發展,大家暫時還沒有看到實際應用,但如果我們多加一點想像力,便可以看到它如何改變電腦與機器等發展,怎麼把電腦變得更強。
從全局來看,電腦現時已經擁有人類的邏輯排序、耳朵的聽力分析、眼睛的分析能力,剛開始擁有學習能力,接下來就看 AI 人工智能在學習後的思考能夠發展到什麼程度了。