網站首頁
學術動态 首頁 - 學術動态 - 正文

面向芯片可靠性的任務調度

2022-07-22 10:56 浏覽次數:

主講人:哈亞軍

職務:上海科技大學教授

報告時間:7月25日16:00-17:00

地點:信科院軟件大樓627會議室

聯系人:張吉良

·個人簡介

哈亞軍教授在浙江大學、新加坡國立大學及比利時魯汶大學分别獲得電子工程學士、碩士及博士學位。他目前是上海科技大學教授,國家自然科學基金首屆外國資深學者研究基金獲得者,IEEE Transactions on Circuits and Systems II: Express Briefs(2022-2023)主編(Editor-in-Chief),上海高能效與定制人工智能芯片工程技術研究中心主任。他曾是新加坡信息通信研究院實驗室主任,以及新加坡國立大學電子與計算機工程系的兼職副教授和助理教授。他的研究興趣包括FPGA電路/架構/工具、超低功耗數字集成電路和系統,以及以上研究在智能汽車、機器學習和硬件安全中的應用。

·報告摘要

對于邊緣智能計算設備而言,可靠性已越來越成為重要的設計約束,因為人們期望大多數邊緣計算設備即使在複雜環境中都能可靠地工作多年。邊緣計算設備的可靠性可按對系統的影響分為長期可靠性和短期可靠性兩類。影響長期可靠性的重要因素是偏置溫度不穩定性(Bias Temperature Instability,BTI)和電遷移效應(Electromigration,EM);而影響短期可靠性的重要因素是單粒子翻轉現象(Single Event Upset,SEU)。一方面,随着器件使用年限的增加,BTI可導緻器件的延遲增加,更嚴重的是,它可破壞設計的原始時序收斂;同時EM會使金屬導線在大電流的作用下,引起電路開路,從而影響芯片正常工作。另一方面,SEU會影響邊緣智能計算設備中的存儲器和時序邏輯的數據狀态,例如,SRAM或寄存器中的1值數據會錯誤地翻轉為0值,反之亦然。

先前針對BTI和EM長期可靠性的工作主要集中在器件和電路層面,如晶體管BTI和EM效應建模,電路級分析和優化等,未能充分在更有效的系統級探索動态BTI和EM感知的負載模式,更未上下聯動電路級優化。而先前針對SEU短期可靠性設計的工作主要集中在資源利用率極低的三重模塊冗餘方法,如何讓新的基于擦除的方法最優地提高擦除調度成功率是一個挑戰。

針對這些問題,本次報告提出一個工作負載模式感知、基于動态電壓頻率調節(DVFS)的系統和電路聯動的動态調度框架,首先針對BTI和EM約束分别研究基于自适應性應用和基于強化學習的動态調度算法,同時針對SEU約束研究基于擦除的動态調度算法。報告還将介紹高效的DVFS體系結構和精确的在線延時監測技術。