新闻动态
NEWS
新闻动态
半导体技术与制造服务提供商
米兰milan-科研聚焦|南科大深港微电子学院王中锐副教授团队5篇论文被DAC录用
122025-12

近日,南边科技年夜学王中锐副传授团队的5篇顶会论文被国际设计主动化范畴顶级集会DAC2025任命,南科年夜为第一通信单元。DAC(设计主动化集会,Design Automation Conference)是集成电路芯片设计与辅助东西研究范畴的国际顶级集会,也是电子设计主动化范畴的CCF-A类集会,至今已经有62年汗青。2025年的DAC集会将在6月22日至25日于美国加利福尼亚州旧金山的Moscone West会展中央进行。

跟着人工智能技能的快速成长,深度神经收集(DNN)于主动驾驶、医疗保健及金融等范畴的运用愈来愈广泛。然而,DNN加快器的安全性及能效晋升问题日趋凸显。王中锐课题组针对于这两个主要问题,重要完成为了如下事情:

论文一:《Re4PUF: A Reliable, Reconfigurable ReRAM-based PUF Resilient to DNN and Side Channel Attacks》

作者信息:Ning Lin, Yi Li, Yangu He, Songqi Wang, Hegan Chen, Kwunhang Wong, Chuxin Li, Jichang Yang, Yifei Yu, Meng Xu, Yongkang Han, Rui Chen, Xiaoming Chen, Xiaoxin Xu, Jianguo Yang, Dashan Shang and Zhongrui Wang

基在忆阻器(ReRAM)的物理不成克隆函数(PUF)因其低能耗及紧凑尺寸的上风,已经成为一种具备研究及运用远景的硬件安全原语。然而,现有的基在ReRAM的PUF的靠得住性会遭到情况的影响,同时也面对深度神经收集建模进犯及侧信道进犯(SCA)的威逼。本文提出了一种新型的3T2R ReRAM可重构PUF(见图1),经由过程数字3T2R的分压单位设计,提高了基在ReRAM的PUF靠得住性。经由过程调治反相器的供电电压,使PUF无需重擦写ReRAM便可快速、低成当地实现重构,从而防备DNN建模及SCA的威逼。

图片1.jpg

图1:Re4PUF总体设计

论文二:《Guarder: A Stable and Lightweight Reconfigurable RRAM-based PIM Accelerator for DNN IP Protection》

作者信息:Ning Lin, Yi Li, Jiankun Li, Jichang Yang, Yangu He, Yukui Luo, Dashan Shang, Xiaoming Chen, Xiaojuan Qi and Zhongrui Wang

深度神经收集模子部署于基在忆阻器的存算芯片中存于模子安全问题。这是因为忆阻器的非易掉性特色,使患上断电环境下进犯者依然可以读取权值。为此,咱们提出软硬件协同设计解决方案(见图2)。硬件方面,咱们使用3T2R设计的可重构功效来实现模子的加密。这类可重构使患上芯片于差别的密钥下具备差别的前向推理成果。软件方面,咱们提出一种差异化对于比练习要领,确保于授权芯片上模子具备较高的前向推理机能,而于未授权芯片上前向推理机能很低。于图象分类、支解以和天生使命上的年夜量试验验证了咱们要领的有用性。咱们的要领确保模子于授权芯片上险些没有机能降落,而于未授权芯片上的机能降至随机预测或者天生。

图片2.jpg

图2:Guarder总体设计

论文三:《SeDA: Secure and Efficient DNN Accelerators with Hardware/Software Synergy》

作者信息:Wei Xuan, Zhongrui Wang, Lang Feng, Ning Lin, Zihao Xuan, Rongliang Fu, Tsung-Yi Ho, Yuzhong Jiao and Luhong Liang

最近几年来安全DNN加快器备受存眷。该研究提出了一种硬件及软件的协同优化机制,实现了高安全性及高效率的DNN加快器设计(见图3)。其焦点立异包括:1)带宽感知加密机制,采用单个AES引擎并联合密钥扩大模块天生多个怪异的一次性暗码,从而于不增长硬件资源的环境下满意高带宽需求,避免了单位素碰撞进犯,并降低了硬件开消。2)多级完备性验证机制,引入了基在块、层及模子的多粒度完备性验证,削减了安全元数据的存储及拜候需求,经由过程将层或者模子粒度的安全元数据存储于加快器芯片内,险些消弭了对于内存的分外拜候开消,同时避免了从头摆列进犯。3)还有思量了DNN模子中层内及层间的数据块对于齐问题,防止了冗余的加密及解密操作,进一步提高了机能。

图片3.jpg

图3:SeDA总体设计

论文四:《Efficient Edge Vision Transformer Accelerator with Decoupled Chunk Attention and Hybrid Computing-In-Memory》

作者信息:Yi Li, Zijian Ye, Xiangqu Fu, Songqi Wang, Shucheng Du, Ning Lin, Dashan Shang, Jinshan Yue, Zhongrui Wang, Xiaojuan Qi, Feng Zhang and Han Wang

于DNN加快方面,该研究提出一种基在算法-硬件协同优化的边沿视觉Transformer加快器(见图4),旨于解决现有ViT模子于边沿装备上部署时面对的高计较繁杂度、资源耗损年夜以和硬件使用率低等问题。经由过程算法层面的解耦分块留意力机制,采用流水线方式削减片外内存拜候,实现有限片上内存下的高效密集猜测;于架构层面,引入基在SRAM的存内计较与非易掉性RRAM存储的混淆架构,联合交融调理计谋,均衡事情负载并削减中间片上内存拜候;于电路层面,提出双向可重构的CIM宏单位,晋升硬件使用率。该研究为边沿装备上的高能效、低延迟密集猜测提供了立异解决方案,鞭策ViT于主动驾驶及监控图象阐发等范畴的广泛运用。

图片4.jpg

图4:边沿端ViT总体设计

论文五:《DANN: Diffractive Acoustic Neural Network for in-sensor computing system target at multi-biomarker diagnosis》

作者信息:Lewei He, Ning Lin, Binbin Cui, Xinran Zhang, Shiming Zhang and Zhongrui Wang

对于在声学体系的加快,该研究提出一种基在衍射声学体系的模仿呆板进修硬件,以和对于应的仿真要领,旨于冲破传统光学生物传感于液体情况举行即时检测的瓶颈(见图5)。经由过程将AI算法与声学传感器集成,体系直接于模仿域处置惩罚微流控生物旌旗灯号,防止模数转换延迟和冯·诺依曼瓶颈,显著晋升能效与及时性。研究聚焦在声学组件的小型化优化,降服光学体系于微流道内难以压缩的缺陷,为便携式医疗装备提供高精度、低成本的即时份子检测方案,鞭策边沿AI于床边诊断中的运用。

图片5.jpg

图5:DANN体系总体设计

-米兰milan