随着各类大模型和深度神经网络涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代AI芯片已成为国际前沿热点。
据微信公众号“清华大学”12日消息,清华大学电子工程系方璐副教授课题组、自动化系戴琼海院士课题组摒弃传统电子深度计算范式,另辟蹊径首创分布式广度智能光计算架构,研制全球首款大规模干涉衍射异构集成芯片太极(Taichi),实现160 TOPS/W的通用智能计算。
该研究成果于北京时间4月12日凌晨以《大规模光芯片“太极”赋能160 TOPS/W通用人工智能》为题发表在最新一期的《科学》(Science)上。 方璐、戴琼海为论文的通讯作者,电子工程系博士生徐智昊、博士后周天贶(清华大学水木学者)为论文第一作者。
“挣脱”算力瓶颈的中国光计算睿智尝试
作为人工智能的三驾马车之一,算力是训练AI模型、推理任务的关键。倘若把大模型当作是做一道精致的菜肴,算力就好比一套称手的烹饪工具。
世人皆知巧妇难为无米之炊,但再好的厨子,没有一口好锅、一把好刀,面对鲜美的食材也只能望而兴叹。 光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算,以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。
光芯片具备高速高并行计算优势,被寄予希望用来支撑大模型等先进人工智能应用。 智能光计算作为新兴计算模态,在后摩尔时代展现出有望超越硅基电子计算的潜力。然而其计算任务局限于简单的字符分类、基本的图像处理等。其痛点是光的计算优势被困在了不适合的电架构中,计算规模受限,无法支撑亟需高算力与高能效的复杂大模型智能计算。
行胜于言,直面科研领域痛点问题,帮助光计算“挣脱”算力瓶颈,另辟蹊径,“从0到1”重新设计适合光计算的新架构,是这个清华团队迈出的关键一步。
光电智能技术交叉创新团队部分成员合影(左三为戴琼海院士、右二为方璐副教授)
从“无极”而至“太极”的双向奔赴 从构思到实验,开辟新赛道、做第一个吃螃蟹的人往往都伴随着巨大的困难与压力。
每一个研究成果的背后,都凝缩了团队每一位成员的心血,是历经无数失败与彻夜难眠后,结出的那颗最耀眼的结晶。但方璐却将这次科研历程比拟为一场浪漫的“双向奔赴”:从算法架构上自顶向下探索,在硬件芯片设计上自底向上推演。 相异于电子神经网络依赖网络深度以实现复杂的计算与功能,“太极”光芯片架构源自光计算独特的‘全连接’与‘高并行’属性,化深度计算为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。
据论文第一作者、电子系博士生徐智昊介绍,在“太极”架构中,自顶向下的编码拆分-解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布式‘大感受野’浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。
学科交叉融合,探索无限可能
“太极”光芯片的诞生是多学科交叉碰撞、探索无限的过程。 从一个初步设想到打破常规思维、确立科研思路,从理论计算到架构创新,再到模拟试验、现场实测......每一个重大突破性研究,都涉及不同学科高度交叉融合,催生出“0到1”的成果。
北京信息科学与技术国家研究中心的光电智能技术交叉创新团队由来自电子系、自动化系、集成电路学院、软件学院的领域学者和专门研究人员组成。 在这里,“理学思维融合工科实践,交叉领域践行原始创新”的理念一以贯之,团队始终致力于为中国成为世界科学中心和创新高地贡献出清华力量。
和团队的对话中,“初心”和“坚持”两个词语,被多人反复提及。恰如团队成员所言,“科学研究是一个厚积薄发的过程,不是一蹴而就的,就像在黑暗中来回摸索,可能会经历反复失败,但一定要坚持自己的初心。” 一次次“推翻重来”“背水一战”的底气背后,是什么支撑着团队的坚持求索? 答案是:良好的学术环境和有组织科研的全方位保障。
2021年4月19日,习近平总书记在清华大学考察时强调,重大原始创新成果往往萌发于深厚的基础研究,产生于学科交叉领域,大学在这两方面具有天然优势。要保持对基础研究的持续投入,鼓励自由探索,敢于质疑现有理论,勇于开拓新的方向。
|