在2018年CCF-GAIR(全球人工智能与机器人峰会)人工智能公共服务技术咨询服务环节,清华大学微电子学研究所所长魏少军教授发表了题为“什么是真正的通用人工智能芯片”的深入洞见,为当时方兴未艾的AI芯片热潮带来了冷静的思考与清晰的方向指引。
魏教授首先指出,随着深度学习在图像识别、语音处理等领域取得突破性进展,市场对专用AI加速芯片(如GPU、TPU等)的需求激增。这些芯片大多针对特定的算法模型(如卷积神经网络)进行优化,属于“专用人工智能芯片”。它们在特定任务上效率极高,但灵活性和通用性不足,难以适应快速演进、多样化的AI算法与应用场景。
什么是“真正的通用人工智能芯片”?魏少军教授阐述,其核心特征在于“通用性”与“智能化”的深度融合。它并非简单地在现有CPU/GPU架构上增加AI加速单元,而应具备以下几个关键特质:
- 架构创新与灵活性:真正的通用AI芯片需要一种全新的、可动态重构的硬件架构。它应能高效支持不仅限于深度学习,还包括强化学习、类脑计算、符号推理等多种人工智能范式,并能根据不同的软件任务,实时优化配置计算、存储和通信资源。
- 高能效与自适应学习能力:它必须在极低的功耗下实现强大的算力,满足从云端服务器到移动终端、物联网设备的全场景部署需求。更重要的是,芯片本身应具备一定程度的片上学习与自适应能力,能够根据环境与数据变化进行动态调整,而不仅仅是执行预先训练好的固定模型。
- 软硬件协同与生态建设:芯片的设计必须与编译器、编程模型、算法框架乃至上层应用进行深度融合与协同优化。一个强大的软件工具链和开放的生态系统,对于释放通用AI芯片的潜力至关重要。魏教授强调,没有良好的软件支撑,再先进的硬件也无法发挥价值。
- 解决AI计算的根本矛盾:魏教授深入分析了AI计算中“访存瓶颈”、“能效墙”等根本性挑战。通用AI芯片的设计需要从底层原理出发,探索存算一体、近似计算、神经形态计算等新型技术路径,从根本上打破传统冯·诺依曼架构的局限,实现计算与存储的高效融合。
在演讲中,魏少军教授也提醒业界需保持理性。他指出,AI芯片的发展是一场“马拉松”,而非“短跑”。真正的通用人工智能芯片的成熟需要跨学科、跨领域的长期深耕,涉及材料、器件、架构、电路、算法、软件等多个层面的协同突破。它不仅是技术产品,更是未来智能社会的核心基础设施。
魏教授结合“人工智能公共服务”这一峰会主题强调,通用人工智能芯片的终极目标,是赋能千行百业,降低AI技术的使用门槛和能耗成本,使其像电力一样成为稳定、可靠、经济的基础公共服务。这要求芯片设计者不仅要追求极致的性能参数,更要深入理解产业端的真实需求,推动AI技术普惠化、平民化。
魏少军教授的此番论述,在2018年为AI芯片的研发指明了超越短期热潮、面向长远未来的战略方向——即追求通过底层创新,打造出兼具强大算力、超高能效、卓越灵活性和广泛适应性的“真正通用”智能计算基石,从而支撑人工智能技术持续、健康地融入并变革社会生产与公共服务体系。