在線閱讀雜志

    2018年05月20日

    第10期 總第484期

    封面文章
    “網銀”殊途同歸路
    金融服務似乎正在以你想要的方式前行。 相應的,金融的生態及格局也在發生重大變化。技術的推動讓金融的數字化轉型愈發明顯,傳統金融機構“離柜率”同互聯網銀行業務激增形成強烈的對比。[詳細]
    精彩推薦
  • 快乐双彩今晚开奖号码:首款可重構超低功耗人工智能芯片TX210量產 可重構架構優勢凸顯

    天天快三彩票网 www.ituvj.com 時間:2019-07-08    來源:    作者: 我要評論() 字號:T | T

  • 消息稱:全球首款可重構超低功耗人工智能芯片TX210已實現規?;坎?,生產商清微智能表示: TX210是一款語音SoC芯片,針對多種應用場景的智能終端產品開發,將于6月中旬正式交付市場,客戶主要來自于手機、家居,玩具及智能穿戴設備廠商。

    清微智能核心技術團隊來自清華微電子所,在正式推出商用芯片TX210前,一直在做的一件事便是——以更先進的可重構計算追求更低的功耗,最高的能效比。

    謀定而后動

    提起中國芯片產業,就不能不提輸送了占據中國半數芯片公司創始團隊與高管的清華大學,提到清華芯片,繞不開微電子學研究所。而這其中的靈魂人物正是現任清華大學微電子學研究所所長,被譽為中國芯片技術領頭人的魏少軍教授。

    十三年前的2006年,意識到可重構計算架構對于芯片算力提升、功耗降低的巨大優勢,魏少軍教授牽頭成立了清華大學可重構計算研究團隊。十多年來,由魏少軍教授帶領的團隊一直在進行著可重構計算的研發。

    而這支團隊正是后來清微智能的核心。

    “做AI芯片勿自欺欺人,架構創新很關鍵。“魏教授曾不止在一個場合強調架構對AI芯片的重要作用。

    隨著2015年,AI在全球的第三次全面興起,AI算法對芯片運算能力遠高于傳統芯片的要求,讓能效更高、基本架構上與AI算法渾然天成的可重構計算開始異軍突起,驗證了魏教授的提醒,也讓基于此架構的芯片開始進入“聚光燈“下。

    2017年6月,團隊的第一代人工智能芯片Thinker-Ⅰ推出,在2017VLSI國際研討會上,當團隊公開介紹這顆花費數年時間設計的芯片時,外界給出了極高的評價:(Thinker)突破了神經網絡計算和訪存瓶頸,實現了高能效多模態混合神經網絡計算。

    2017 ACM/IEEE ISLPED會議獲設計競賽獎;ISCA 2018發表了中國唯一第一作者論文?!堵槭±砉た萍計纜邸吩拋某疲篢hinker芯片論文發表在國際集成電路頂級期刊IEEE Journal of Solid-State Circuits上,對于中國來說,是件很了不起的事情,這顆支持神經網絡的芯片,最特別之處就在于它的極低功耗。

    2018年7月,預測到AIoT市場將步入全面爆發期的研發團隊,在北京中關村注冊成立北京清微智能科技有限公司,十多年扎實的技術積累,200多項技術專利,一旦投入市場,在不到一年時間交出的量產TX210芯片,水到而渠成。

    為什么是可重構?

    傳統人工智能芯片,主要基于CPU/DSP/GPU/NPU架構, 這些架構本質屬于指令驅動的計算模式。在具體計算過程中,需要從指令存儲器中加載指令并解析指令,然后指導執行單元進行計算。在每次的數據計算中,這樣的過程都不可避免,因此這是一種靈活但是低效的時域計算模式。

    在AI芯片的研發過程中,也有利用SIMD方式來提高數據復用以減少指令解析,但是SIMD面向的是同構的操作,當指令功能變換時,仍需要重復前面的過程。

    可重構計算(CGRA)是一種無需指令驅動的計算模式,它基于數據流圖,面向的是異構的空域計算,一次配置形成固定的電路結構,從而以接近ASIC效率反復執行,資源利用率和數據復用率高。同時,相比ASIC方式的固定電路結構,它又可以依據應用或者算法進行電路配置,形成不同的計算電路結構,具有非常強的靈活性。

    “指令驅動”的時域計算模式 v.s. “數據驅動、動態重構”的空間計算模式

    清微智能CTO歐陽鵬透露,在可重構計算更低能耗和更強靈活性的基礎上,清微在具體的芯片設計上,又做了兩方面深化。

    主流神經網絡算法具有混合數據精度表示的特點,即不同的神經網絡層可用不同數據位寬來表達中間數據或者權重數據的精度。

    傳統AI架構無法高效支持混合精度計算,或者只能通過擴展資源方式支持少數幾種精度。歐陽鵬表示:清微AI芯片產品,支持從1bit-16bit的混合精度計算,同時,不同的神經網絡層可以采用不同的精度表示,可實現實時切換精度。在具體實現過程中,可重構模式動態重組計算資源和帶寬,根據精度表示,讓計算資源和帶寬接近滿負荷進行計算,從而將混合精度網絡下的計算資源和帶寬的利用率逼近極限,高效支持多種混合精度的神經網絡。

    另外一方面,人工智能算法,除了神經網絡中卷積層,全連接層等邏輯,還有非神經網絡計算邏輯。比如人臉檢測和識別中,有NMS(非極大值抑制)以及仿射變換。在語音識別中,有FBANK/MFCC特征提取以及聲學解碼等。同時,非神經網絡算法也在快速演進。比如最新NMS已經演化到Soft-NMS。

    傳統AI芯片架構,強調了神經網絡邏輯的計算效率,卻忽視了非神經網絡邏輯的計算效率。針對非神經網絡邏輯,一般仍然采用CPU或者DSP進行處理,或者采用ASIC進行固化。清微AI芯片產品針對神經網絡部分和非神經網絡部分均進行了計算效率考慮。針對非神經網絡處理邏輯,從算法數據流圖進行空間映射,以接近ASIC效率計算。同時,通過配置形成不同的電路結構來動態處理不同非神經網絡計算邏輯,在保證靈活性前提下,計算效率有極大提升。

    豈止于最高的能效比

    面臨AI終端市場,算力能耗比、時延、成本一個都不能少,業界少有的十多年的技術積累和底層的架構設計能力讓TX210很好的滿足了這些衡量標準。

    據介紹:TX210采用TSMC40ULP工藝,支持WLCSP和QFN兩種產品封裝。

    芯片采用多級功耗喚醒模式,極大的降低了芯片的功耗,工作功耗mW級,VAD功耗僅uW級。

    TX210芯片可編程可重構,結構上有著極強的靈活性,支持多比特DNN神經網絡,可以支持1-16bit位寬的神經網絡計算,也支持FFT/MEL FILTER等。

    TX210還有一個顯著特點就是用極小的芯片面積支持豐富的接口和電源管理。TX210的WLCSP封裝面積僅有2.3X1.9mm2,適用于手機,藍牙耳機等對體積要求苛刻的應用場景;同時TX210集成了LDO/ADC/BANDGAP/PGA等模擬器件,支持32K crystal輸入,極大降低了用戶的使用成本。

    值得一提的是,采用算法+芯片的協同設計優化,TX210在典型信噪比下,喚醒識別率95%,誤識別率小于24小時一次。

    豐富的應用場景,定制的AI芯片

    “中國已成為全球最大的智能終端生產和消費國。”工信部電子科技委副主任莫瑋日前表示。盡管智能終端產品在2018年有了井噴式發展,以最有代表性的智能音箱為例,2018年第四季度的出貨量增長了95%,但業界普遍認為:終端智能的滲透率尚不足1%。這意味著,智能終端市場規模遠未達到預期,當然也意味著AI芯片市場的巨大潛力。

    而作為人機交互的首要途徑,語音AI芯片必將率先實現大規模量產和落地。

    語音AI芯片可應用至智能手機、可穿戴智能設備、小家電、大家電、玩具及車載等眾多場景,找準場景需求,投產的TX210針對語音交互場景做了更多的優化。例如:為保持極低功耗狀態,芯片只有在檢測到人聲時,才被激活;被激活的芯片準確監聽到命令后,才會喚醒休眠的處理器芯片;芯片支持一語直達功能,處理器要處理的僅為喚醒詞之后的語音信號內容。

    清微創始人CEO王博表示:基于對清微團隊技術積累的認可和產品的信任,在TX210正式上市前,公司已與一些大型的互聯網公司,智能手機及家電廠商建立了合作關系。

    提供以端側為基礎,并向云側延伸的芯片產品及解決方案的清微智能,對于未來的產品路線已經有了清晰的規劃,據悉今年下半年公司將發布視覺芯片,并持續迭代更新核心計算架構,進一步提升芯片的計算能效比。

    AI時代,美國關注基礎算法,歐洲關注倫理道德,而在中國,經濟的快節奏和龐大的市場規模,讓AI在應用層面如火如荼。AI芯片同樣如此,除了尚未形成巨無霸的壟斷局面外,中國龐大的用戶群所形成的獨特優勢,使得企業可以更快地根據用戶體驗更新芯片設計。

    AI芯片,中國未來可期!

  • 加入收藏
  • [ 作者: ]
  • 分享到: 更多
    標簽:
  • 相關推薦
    無相關信息
  • 最新消息
    · 首款可重構超低功耗人工智能芯片TX210量產 可重構架構優勢凸顯2019-07-08
    · 軟通動力全面布局 助力企業數字化轉型2019-07-08
    · 熱烈恭祝金豬下崽4.0全球發布會圓滿落幕2019-07-08
    · 直擊2019夏季達沃斯:盤點中國大佬的觀點,他們都說了什么2019-07-08
    · 2019夏季達沃斯論壇開啟 聚焦全球化新時代成功之道2019-07-08