2022年02月08日
無(wú)論是Fabless,還是IDM,不少大廠其實(shí)都在關(guān)注邊緣AI的市場(chǎng),比如英特爾的Movidius和英偉達(dá)的Jetson等等。但市面上也有一些廠家在發(fā)力類(lèi)腦芯片的開(kāi)發(fā),同時(shí)探索新架構(gòu)的芯片上將用到怎樣的軟件開(kāi)發(fā)生態(tài)。因?yàn)檫@些類(lèi)腦芯片往往用到的是脈沖神經(jīng)網(wǎng)絡(luò)(SNN),直接拿常用的卷積神經(jīng)網(wǎng)絡(luò)(CNN)或人工神經(jīng)網(wǎng)絡(luò)(ANN)硬套的話,是萬(wàn)萬(wàn)行不通的。也正是因?yàn)檐浻布系碾p重挑戰(zhàn),限制了類(lèi)腦芯片的商用。
英特爾的類(lèi)腦芯片已經(jīng)研究了近5年之久了,早在2017年英特爾就發(fā)布了基于14nm制程的Loihi芯片,該芯片具備13萬(wàn)個(gè)神經(jīng)元,1.3億個(gè)神經(jīng)突觸。2021年英特爾又公布了Loihi的繼任者Loihi 2,該芯片基于更名后的Intel 4制程,將芯片大小從60mm2縮小至31mm2,卻依然集成了百萬(wàn)個(gè)神經(jīng)元和1.2億神經(jīng)突觸。
Loihi 2類(lèi)腦芯片 / 英特爾
雖然這些Loihi芯片都具備可觀的規(guī)模,但類(lèi)腦芯片并沒(méi)有走向HPC的高性能之路,而是繼續(xù)堅(jiān)持低功耗的優(yōu)勢(shì),這一點(diǎn)從英特爾在評(píng)估Loihi時(shí)進(jìn)行的應(yīng)用展示也可以看出。英特爾稱(chēng)在三年多的研究中,他們嘗試的應(yīng)用有自適應(yīng)機(jī)器臂控制、學(xué)習(xí)與識(shí)別新的氣味與手勢(shì)、比視覺(jué)輸入延遲更低的無(wú)人機(jī)電機(jī)控制,以及解決鐵路調(diào)度等優(yōu)化問(wèn)題。在這些應(yīng)用中,與傳統(tǒng)CPU加GPU方案動(dòng)輒幾百瓦的功耗相比,Loihi的功耗甚至不到1W,可以做到mW級(jí)的功耗和ms級(jí)響應(yīng)時(shí)間。
當(dāng)然了,單靠類(lèi)腦芯片的硬件是遠(yuǎn)遠(yuǎn)不夠的,類(lèi)腦芯片商業(yè)化進(jìn)展緩慢的一大原因就是缺乏清晰高效的編程模型,為此英特爾開(kāi)發(fā)了一個(gè)開(kāi)源類(lèi)腦計(jì)算框架Lava。Lava不僅支持離線訓(xùn)練,還可以集成TensorFlow、PyTorch和ROS這樣的第三方框架,開(kāi)發(fā)者可以自行對(duì)其進(jìn)行擴(kuò)展。
Oheo Gulch板卡 / 英特爾
不過(guò)英特爾的Intel 4制程還未正式面世,目前只準(zhǔn)備了兩種Loihi 2硬件供研究人員遠(yuǎn)程線上測(cè)試,一個(gè)是用于早期評(píng)估的單片系統(tǒng)Oheo Gulch,另一個(gè)則是尚未面世的8芯片系統(tǒng)Kapoho Point。
英特爾的類(lèi)腦芯片尚處于發(fā)展初期階段,即便是第二代Loihi目前也僅僅只是研究芯片,并沒(méi)有一個(gè)定下來(lái)的商用路線。反觀其他的大廠,IBM的TrueNorth芯片已經(jīng)多年沒(méi)有動(dòng)靜,而三星的類(lèi)腦芯片雖然已經(jīng)宣布可量產(chǎn),但還沒(méi)有任何成品或設(shè)計(jì)面世。反倒是一家名不見(jiàn)經(jīng)傳的公司,BrainChip,最先開(kāi)啟了類(lèi)腦芯片的商業(yè)化道路。
Akida類(lèi)腦處理器 / BrainChip
去年10月BrainChip發(fā)布了兩款開(kāi)發(fā)套件,分別是用于x86的Shuttle PC套件和用于Arm樹(shù)莓派的套件,兩個(gè)套件均采用了BrainChip的類(lèi)腦芯片 AKD1000。AKD1000類(lèi)腦芯片基于BrainChip 的Akida IP和臺(tái)積電28nm制程,卻做到了120萬(wàn)個(gè)神經(jīng)元和100億的神經(jīng)突觸的規(guī)模,功耗范圍在微瓦級(jí)到毫瓦級(jí)。BrainChip也為Akida處理器準(zhǔn)備了MetaTF這一開(kāi)發(fā)環(huán)境,支持利用Python編程語(yǔ)言和Jupyter notebooks、Numpy這樣的開(kāi)發(fā)工具和庫(kù),輕易將CNN轉(zhuǎn)換成SNN。
除了PCIe和Mini-PCIe的開(kāi)發(fā)套件外,Akida也開(kāi)始在汽車(chē)市場(chǎng)露面了。在今年CES梅賽德斯奔馳展示的Vision EQXX概念車(chē)中,其語(yǔ)音控制系統(tǒng)就用到了BrainChip的Akida類(lèi)腦芯片。根據(jù)梅賽德斯奔馳的聲明,Akida類(lèi)腦芯片為其語(yǔ)音控制系統(tǒng)中的關(guān)鍵詞檢測(cè)提供了更低的功耗,與傳統(tǒng)的語(yǔ)音控制方案相比效率提升了5到10倍。從BrainChip的急速商業(yè)化來(lái)看,類(lèi)腦芯片并不一定要像英特爾的Loihi一樣用上先進(jìn)制程,也能做到優(yōu)秀的性能。
不少高校同樣開(kāi)展了類(lèi)腦芯片的研究,其中之一就是浙江大學(xué)。2015年和2019年,浙江大學(xué)分別推出了第一代和第二代達(dá)爾文類(lèi)腦計(jì)算芯片,其聯(lián)合之江實(shí)驗(yàn)室也在2020年成功研制出當(dāng)時(shí)神經(jīng)元規(guī)模最大的類(lèi)腦計(jì)算機(jī)Darwin Mouse。該計(jì)算機(jī)內(nèi)部包含792顆達(dá)爾文2代類(lèi)腦芯片,共1.2億神經(jīng)元,近千億神經(jīng)突觸,功耗范圍在350W到500W范圍內(nèi),由此計(jì)算達(dá)爾文2代類(lèi)腦芯片的單片規(guī)模為15萬(wàn)神經(jīng)元和1.2億神經(jīng)突觸左右。
這792顆芯片采用了每四顆芯片組成一塊板子,再由多塊板子組成模塊打造類(lèi)腦計(jì)算機(jī),由此可見(jiàn)的達(dá)爾文2代類(lèi)腦計(jì)算芯片的擴(kuò)展性。為了完成神經(jīng)元的高效互聯(lián)和調(diào)用,其科研人員還開(kāi)發(fā)了面向該計(jì)算機(jī)的類(lèi)腦操作系統(tǒng)DarwinOS,并基于該計(jì)算機(jī)和操作系統(tǒng)完成了多種智能任務(wù),比如多個(gè)抗洪搶險(xiǎn)機(jī)器人的協(xié)同、基于腦電信號(hào)的“意念打字”和音樂(lè)詩(shī)詞的時(shí)序記憶等。
不過(guò)這樣的類(lèi)腦計(jì)算機(jī)體積依然是一個(gè)問(wèn)題,在792顆芯片的拼裝下,這臺(tái)計(jì)算機(jī)占據(jù)了3個(gè)1.6米高的機(jī)柜,如何進(jìn)一步減小芯片體積都是實(shí)現(xiàn)邊緣AI計(jì)算最急迫的問(wèn)題。而且達(dá)爾文芯片的規(guī)模還有提升的空間,Darwin Mouse類(lèi)腦計(jì)算機(jī)的神經(jīng)元和突觸規(guī)??此坪艽螅c生物大腦相比也就只有小鼠大腦的規(guī)模,離人類(lèi)的大腦規(guī)模還有很大的差距。雖然可以犧牲體積,但這與邊緣AI的愿景就有些背道而馳了。
從目前的應(yīng)用市場(chǎng)來(lái)看,類(lèi)腦芯片尚處于一個(gè)研究發(fā)展階段,還存在軟硬件開(kāi)發(fā)不成熟的問(wèn)題。雖然已經(jīng)有了大廠入局,但目前連量產(chǎn)都不成熟,應(yīng)用方向上也在探索傳統(tǒng)AI芯片走過(guò)的老路。固然類(lèi)腦芯片的前景值得期待,至于大規(guī)模商用,仍是一個(gè)比較遙遠(yuǎn)的夢(mèng)。