面向深度学习的系统结构研究处于起步阶段,仍存在着可靠性、可用性等诸多方面的问题。具体而言,系统结构现在呈现异构化的发展趋势,其中引入的AI专用架构成为了整个系统的可靠性短板。另一方面,深度神经网络的不断增长的算力需求以及其黑盒的推理过程制约了其在自动驾驶、智能安防等安全优先场景下的应用。
在上述因素的驱动下,我们开展了一系列研究,这些研究的核心思路都是基于数据流模型。除了利用数据流思想来设计芯片体系结构之外,我们还在系统软件层来使用数据流,提出了跨域的数据流分析框架与管理机制,实现高可靠的异构计算系统。此外,我们还进行了深度学习模型与体系结构的跨层优化,通过设计对于底层硬件体系结构执行效率友好的矩阵块数据流,从而在无需修改现有硬件架构的基础上,利用深度神经网络的稀疏特性对其进行加速。最后,我们还提出在深度学习模型这一层面进行数据流分析,提升了深度模型的可解释性和鲁棒性,并能根据数据流动态地对深度神经网络进行稀疏化剪枝和加速。