丝袜诱惑一区二区三区,91精品成人AAA片

【北京,朝陽區(qū)】微電子所在高吞吐率SRAM存內(nèi)計算處理器芯片領域取得進展的中標單位

發(fā)布時間：2024-07-05

標簽：中標公告北京微電子所在高吞吐率SRAM存內(nèi)計算處理器芯片領域取得進展的中標單位招標信息招標采購

發(fā)布時間	2024-07-05	截止日期	立即查看
聯(lián)系人	立即查看	聯(lián)系電話	立即查看
項目地址	立即查看	設備詞	立即查看
中標機構/單位	立即查看	中標人名稱	立即查看
中標金額	立即查看	網(wǎng)址	立即查看

下文中****為隱藏內(nèi)容，僅對中項網(wǎng)會員用戶開放，?【注冊 / 登錄】?后可查看內(nèi)容詳情

中標公告詳情

微電子所在高吞吐率SRAM存內(nèi)計算處理器芯片領域取得進展稿件重點實驗室張鋒、張康瑋責任編輯：張鋒、張康瑋發(fā)布時間：2024-07-05 目前，ChatGPT等大型AI算法的出現(xiàn)對計算設備性能提出了更高要求。存內(nèi)計算（CIM）有效緩解了傳統(tǒng)馮諾依曼架構中的內(nèi)存墻問題。盡管無法完全解決存儲墻問題，但CIM架構通過定制化設計方***元和計***路結(jié)合在一起，本質(zhì)上提高了操作數(shù)的傳輸帶寬，大大降低了這部分數(shù)據(jù)的傳輸代價***許多具有高計算能效的數(shù)字CIM架構處理器的工作被提出。這些工作通過定制化設計***路徑控制微架構和稀疏優(yōu)化微架構，能夠在計算不同類型的主流AI算法（如CNN、Transformer）時實現(xiàn)很高的計算能效。然而CIM架構的計算特點是多個周期得到MAC計算結(jié)果，不能像傳統(tǒng)數(shù)***路一樣在流水線填充后每個周期都能得到MAC計算結(jié)果。這使得CIM架構的應用場景被限制在邊緣端的低功耗場景，而非高性能場景。如何在保持CIM計算架構高能效的同時解決其吞吐率不足的缺點是CIM架構成為AI計算領域通用***路上的關鍵問題。針對該關鍵問題，中國科學院微電子研究所劉明院士/張鋒研究員團隊研發(fā)出基于Radix16+LUT技術的SRAM存內(nèi)計算處理器芯片。該工作分別***路級、微架構級和數(shù)據(jù)級三個層面提出了通用的性能優(yōu)化技術，在保持CIM架構高計算能效的同時，提高了其在通用AI計算領域的的吞吐率。 ***路層面，團隊使用Radix16+LUT的技術將INT8*INT8的計算周期數(shù)量降低到2，首次實現(xiàn)了該數(shù)據(jù)精度下的2周期計算（之前最好記錄是4周期）；使用LUT技術盡可能降低其中權重編***路的動態(tài)功耗開銷，使得單周期內(nèi)***路計算功耗降低了21.7%，最終實現(xiàn)了1.84-2.44倍的MAC計算功耗降低和2-4倍的吞吐率提升。在微架構層面，團隊提出了可配置Winograd/Spatial混合***路徑微架構和像素/通道混合映射方法。使用訓練的方法決定在算法的每一層使用哪種等級的Winograd算法實現(xiàn)計算吞吐率的提升。在算法workload映射上，為了在保持高并行度的同時增加硬件利用率，處理器結(jié)合像素/通道混合映射方法在intra-macro使***道順序映射；在inter-macro使用像素順序映射。最終，該項技術在算法準確率損失小于2.2%的同時幫助處理器取得了2.59倍的吞吐率提升。在數(shù)據(jù)層面，團隊充分調(diào)研了近幾年稀疏優(yōu)化技術的代表性工作并分類總結(jié)，在這些工作的基礎上提出了macro級并行稀疏優(yōu)化策略。對于激活數(shù)據(jù)稀疏以每個macro的輸入數(shù)據(jù)為一組，以組為單位***-跳過的方式挑選出能夠被跳過的稀疏數(shù)據(jù)實現(xiàn)稀疏激活數(shù)據(jù)優(yōu)化。對于權重數(shù)據(jù)使用水平方向緊湊排列的方式將權重數(shù)據(jù)向水平方向壓縮，從而實現(xiàn)稀疏權重數(shù)據(jù)的計算跳過。計算出的結(jié)果數(shù)據(jù)根據(jù)激活數(shù)據(jù)檢測索引和權重數(shù)據(jù)索引在輸出結(jié)果寄存器中重新排列為稀疏跳過操作之前的數(shù)據(jù)格式。且為了減少因為稀疏優(yōu)化導致的計算停頓，在interval-cycle處理部分稀疏數(shù)據(jù)以實現(xiàn)latency hiding。該項稀疏優(yōu)化技術解決了以往該領域類似技術中計算并行度受限、對權重數(shù)據(jù)格式有特殊要求和稀疏策略通用性不夠高（如需要重新訓練的結(jié)構化稀疏）的問題，是一種通用的稀疏優(yōu)化策略，最終幫助處理器提升了3.11倍的計算吞吐率。上述設計在28nm 工藝上得到驗證，在提出的三種技術支持下實現(xiàn)了最高258.5TOPS/W的峰值計算能效。相比已有的state-of-the-art CIM處理器工作其標準化計算吞吐率提升了2.04-3.05倍，計算能效提升了2.55-3.45倍。該工作使用分層解耦合的思想***路、微架構和數(shù)據(jù)三個層面充分探索其設計空間，針對CIM架構處理器分別提出了通用的吞吐率優(yōu)化技術。這一研究結(jié)果為通用目的的高性能CiM架構處理器設計提供了***路。 ????上述研究成果以題為“A 28-nm 19.9-to-258.5-TOPS/W 8b Digital Computing-in-Memory Processor With Two-Cycle Macro Featuring Winograd-Domain Convolution and Macro-Level Parallel Dual-Side Sparsity”發(fā)表在集***路設計領域旗艦期刊IEEE Journal of Solid-State Circuits上，微電子所博士研究生吳昊為第一，微電子所張鋒研究員與清華大學陳勇教授為通訊。該研究得到了科技部重點研發(fā)計劃、國家自然科學基金、中國科學院戰(zhàn)略先導專項等項目的支持。 ????全文鏈接：http***&arnumber=*** 圖1 (a) 處理器整體架構圖，(b) 兩種工作模式的數(shù)據(jù)流向圖2 (c) 芯片die photo ，(d) 總結(jié)表格

立即登錄還不是會員？立即免費注冊

24小時咨詢熱線: 400-816-1360

上一篇：國家自然科學基金重點項目
下一篇：秭歸縣楚文化旅游街項目商業(yè)服務中標結(jié)果公告

91精品人妻一区二区50路|99久久99中文字幕|亚洲一个区无码AV|欧州aV亚州aV一区二区|国产Av有码无码精品久热|亚洲高清无码视频,第|页

中標公告詳情

會員特色服務

熱詞專題

地區(qū)導航

熱門項目信息