【禹风大讲堂】第27期：黄沛博士作“深度学习系统的安全性分析”专题讲座

发布者：陈士超发布时间：2024-06-20浏览次数：105

6月19日下午，我校在图书馆五楼报告厅如期开展了第27期禹风大讲堂，主题为深度学习系统的安全性分析。本次讲座由计算机与数据工程学院院长徐军主持，邀请到了美国斯坦福大学计算机系博士后黄沛作为演讲嘉宾。

黄沛博士后师从著名自动推理专家Clark Barrett教授，主要研究方向包括自动推理和可信AI。目前已在计算机领域 IJCAR、CAV、AAAI、IJCAI、ISSTA、ASE、NeurIPS、WWW等国际高水平会议上发表论文20 余篇，曾获 CCF-A 类推荐会议 ISSTA 优秀论文奖、中国科学院优秀博士学位论文、中国科学院院长奖等。

黄沛博士后首先介绍了深度学习的基本概念及其在计算机视觉、自然语言处理、语音识别和合成、医疗、自动驾驶和金融等领域的广泛应用，回顾了深度学习的重要发展历程，比较了深度学习相比传统AI技术的优势与劣势。随后，黄沛博士后详细讲解了深度学习面临的安全性挑战，以鲁棒性和后门攻击为例进行重点分析。为应对这些挑战，他基于弱鲁棒性提出了用扰动打败扰动和多样性模型叠加的思路，并通过具体案例和实验证明，这些方法能够有效提高深度学习模型的抗攻击能力。此外，黄沛博士后还讨论了大语言模型的安全问题，特别是越狱和提示词注入攻击。他使用生动的例子让大家了解到这些漏洞可能导致的不良后果，并提出结合可解释性更强的传统机器学习技术去开发更健全的防御机制，以确保大型语言模型的安全可靠性。

在交流互动环节中，针对老师和同学们提出的AGI（通用人工智能）发展前景、AI研究技术的伦理审查、计算机算法如何辨别并过滤仿造人脸等问题，黄沛博士后进行了细心讲解，让大家对深度学习技术有了更深入的了解。

黄沛博士后的讲座不仅深入浅出地讲解了深度学习的最新研究成果和安全性挑战，还通过丰富的案例和实践经验，激发了在场师生对深度学习及其安全性的关注和思考，为我校未来在这一领域的研究与应用提供了指导和借鉴。在听众们的掌声中，第27期禹风大讲堂圆满结束。

（文/桑启悦图/融媒体中心审/陈士超）