<var id="r1557"><strike id="r1557"></strike></var><var id="r1557"><strike id="r1557"></strike></var>
<cite id="r1557"><video id="r1557"><thead id="r1557"></thead></video></cite>
<var id="r1557"><strike id="r1557"></strike></var>
<var id="r1557"><dl id="r1557"></dl></var>
<menuitem id="r1557"><strike id="r1557"></strike></menuitem>
<var id="r1557"></var>
<var id="r1557"><dl id="r1557"><listing id="r1557"></listing></dl></var>
<var id="r1557"><video id="r1557"><thead id="r1557"></thead></video></var>
<cite id="r1557"><video id="r1557"><thead id="r1557"></thead></video></cite>
<var id="r1557"></var>
<cite id="r1557"></cite>
<cite id="r1557"><video id="r1557"><menuitem id="r1557"></menuitem></video></cite>

騰訊戰略投資,燧原科技首款AI訓練芯片出爐:性能超越V100

西安市治療白癜風醫院哪家好 http://jbk.39.net/yiyuanfengcai/tsyl_cdwzzxyyy/

機器之心報道

作者:李澤南

由騰訊領投、融資累計超過 6 億元的 AI 芯片公司燧原科技,終于發布了自己的首款產品。

12 月 11 日,燧原科技在上海舉辦了成立以來的首場發布會,推出了完全自主研發的首款 AI 訓練芯片「邃思 DTU」,以及搭載該芯片的 AI 加速卡云燧 T10。燧原科技的新產品,被認為是目前業內性能最為強大的 AI 訓練芯片。

在發布會上,燧原科技創始人、CEO 趙立東展望了燧原投身 AI 芯片研發的愿景:「燧原科技希望能做大芯片、拼硬科技,對標世界最頂級的技術和公司?!?/p>

燧原科技 CEO 趙立東手持云燧 T10。

雖然人工智能的概念很早就已被提出,但從集成電路、半導體芯片的角度來看,AI 計算有著自己的特點,基于機器學習算法,硬件架構需要進行創新。

燧原希望在 AI 訓練芯片這一高端市場上首先發力。目前在這一方向上,GPU 幾乎處于壟斷地位。今年 11 月,OpenAI 發布了最新 AI 算力報告,其中提出 AI 算力的需求每年提升 10 倍——即使在摩爾定律沒有放緩的情況下,現有芯片也無法滿足這樣的需求。這意味著人工智能芯片需要新的架構,從而為芯片公司創造了機會。

最強量產 AI 訓練芯片

邃思 DTU 被認為是目前最為強大的量產 AI 訓練芯片,其采用格羅方德(GlobalFoundries)12nm FinFET 工藝打造,面積高達 480mm2,主芯片包含 141 億個晶體管,同時還采用了先進的 2.5D 立體封裝技術,進一步提高了芯片的信號傳輸速度和帶寬。

燧原科技創始人兼 COO 張亞林展示邃思 DTU。

與之一同發布的首款人工智能訓練卡「云燧 T10」,是一塊面向云端數據中心的 AI 加速卡。它采用標準雙槽位,率先支持 PCIe 4.0,功耗為 225W。其獨特的 25GB 雙向背板互聯方案有別于業內常見的 InfiniBand 并聯方式,能在相同的互聯帶寬下,較大幅度地降低組網的復雜度和成本。

燧原表示,T10 的單卡單精度(FP32)算力達到了 20TFLOPS,且支持單精度 FP32 和半精度 BF16 的混合精度計算。相比之下,英偉達最新的 Tesla V100S 的單精度算力為 16.4TFLOPS,而另一方面,云邃 T10 的功耗更低,這意味著它要比 V100 具有更高的效率。

云燧 T10 支持半精度 BF16 運算,并且達到了 80TFLOPS 的算力,這也讓它成為了谷歌 TPU 以外,業界首款支持這種運算方式的 AI 加速卡?!高@款芯片是燧原科技完全自主設計完成的,完全支持所有已有的、及未來即將出現的 AI 算法?!轨菰萍紕撌既思?COO 張亞林說道。

在發布會上,燧原科技表示 T10 已經實現量產,并將于 2020 年第一季度上市。

與目前很多初創公司發布的 AI 芯片相比,基于數據中心的人工智能訓練芯片相比推理芯片難度更高,通常要求芯片具有高算力、低功耗、強互聯等特性,并支持多種訓練算法,以滿足通用性和能耗的要求。邃思芯片基于可重構芯片的設計理念,其計算核心包含 32 個通用可擴展神經元處理器(SIP),每 8 個 SIP 組合成 4 個可擴展智能計算群(SIC)。SIC 之間通過 HBM 實現高速互聯,通過片上調度算法,數據在遷移中完成計算,實現了 SIP 利用率最大化。

在 AI 芯片的大規模應用中,并聯效率至關重要,燧原在發布會上特別介紹了芯片中使用的高速互聯技術。為實現大規模訓練集群的高效訓練,燧原科技提出了 200GB 雙向 ESL 互聯技術,大幅降低了系統復雜度和成本。

在發布會上,燧原還介紹了云燧 T10 的擴展效率:在并聯多達 1024 張卡時,燧原的板卡仍可以達到超過 70% 的效率(理論最高可以達的效率為 86%)。

8 卡互聯的云邃 T10 服務器(左),以及基于云邃 T11 的服務器(右)。

除此以外,燧原還計劃推出基于 OCP 加速模組(OAM)的「云燧 T11」。它是 T10 的更強大版本,功耗 300W,將于明年 5-6 月正式推出,直接對標 Tesla V100 的 NVLink 版。

模型遷移零成本

在硬件之外,燧原同時發布了計算及編程平臺「馭算」,支持主流深度學習框架,提供完整的編譯、調試、調優工具鏈,并在硬件層開放 SDK,為深度開發者提供細粒度算力編程接口。針對大規模模型集群訓練,如目前流行的 BERT 等,提供分布式調度系統,并針對 ESL 并聯進行優化。

「我們的軟件平臺支持 C/C++語言算子編程??上蜷_發者針對特定場景提供算子級、指令級優化。在未來,我們還會開放更為底層的硬件驅動?!箯垇喠直硎?。

目前,燧原的編程平臺已經完全支持 TensorFlow,公司還計劃在明年上半年對 PyTorch、MXNet、ONNX 等主流深度學習框架提供支持。在軟件方面,燧原希望做到對開發者來說「遷移零成本」。

接受騰訊戰略投資

燧原科技成立于 2018 年 3 月,這家公司已在上海和北京設立了研發中心,公司創始人趙立東、張亞林等人此前均任職于 AMD。目前這家公司已有 207 名員工。

迄今為止,燧原科技已經歷了三輪融資,其中去年 8 月 7 日由騰訊領投的 Pre A 輪最為引人關注,其時融資額高達 3.4 億元,也讓燧原成為了首家和唯一一家被騰訊戰略投資的國內 AI 芯片初創公司。今年 6 月,燧原科技又獲得了 3 億元人民幣的 A 輪融資,紅點中國領投,海松資本、云和資本、騰訊投資、陽光融匯資本、信中利資本跟投。

「我們選擇接受來自騰訊的戰略投資,是因為騰訊在數據、業務場景、算法團隊等方面具備優勢,」趙立東在發布會上表示?!笧榱藢崿F業務落地零的突破,我們必須尋求合作,只有這樣才能讓落地的第一步走成功?!?/p>

相比打造出成型芯片再尋找客戶,燧原科技與騰訊展開全面合作的行動減少了數個月的研發時間。

「騰訊提出的『產品熱啟動』概念與我們不謀而合。在邃思芯片研發的過程中,我們與騰訊的開發者們進行了緊密的合作,這使得我們可以在芯片設計過程中進行有的放矢的改進?!冠w立東說道。

強大完整的團隊,加上高效的合作,讓燧原科技的第一款芯片就超越了當前業界主流產品的性能,創造了研發到量產僅用 20 個月的新紀錄:

邃思芯片于 2018 年 4 月開始研發,內部代號獅子座,在今年 5 月 30 日流片成功。到 9 月 19 日,8 顆芯片全部點亮,完成實驗室測試,開始軟硬件聯調。所有時間節點全部在最初計劃的范圍之內。

下一階段,燧原將面向幾大業務領域推廣自己的產品:

云服務公司(包括公有云、私有云、混合云)

各傳統領域的行業服務公司(金融、保險、醫療、交通等)

AI 超算中心和智慧城市

「目前燧原科技已與騰訊針對通用人工智能應用場景的項目開展密切的合作,未來也將會擴展到更多 AI 應用場景,」趙立東表示?!敢源舜伟l布的新產品作為開端,燧原將提供更多具有高性價比、高能效比、開源開放的完整解決方案,也可以針對不同應用場景的差異化需求提供軟硬件定制化的支持和服務?!?/p>

燧原的芯片發布引起了各界關注,清華大學微電子所所長魏少軍在發布會上表示:「燧原芯片研發邁出第一步的成功,要歸功于團隊的完整性,足夠強大的實力,以及時機和方法的正確。中國今天的集成電路領域熱度很高,但要發展集成電路需要足夠的基礎條件。邃思 DTU 是近年來能夠在全球引起高度關注的芯片?!?/p>

隨著訓練芯片的量產,燧原科技下一步研發計劃也已經浮出水面。這家公司計劃在未來推出自己的推斷芯片系列,構建云端 AI 模型訓練和推理計算的完整解決方案。

機器之心「SOTA模型」:22大領域、127個任務,機器學習 SOTA 研究一網打盡。

點擊閱讀原文,立即訪問。

上一篇:

下一篇:

买生肖的微信群