林云
内容简介
题目
模型的解释与解释的模型
摘要
神经网络的决策基于概率性的数据归纳。然而,当我们训练神经网络及语言模型来解决在偏于逻辑的决策场景(比如代码编辑、自动调试、智能运维等),该种归纳法式的回答往往无法满足很多现实的决策解释与验证需求。从开发和训练的角度,我们难以溯源数值型的概率到底从何而来;从使用的角度,我们难以从数据归纳的结论中建立真正的信任。
在本次报告从模型的解释与解释的模型两个角度来介绍我们最近的工作。本次报告的前半部分介绍我们关于模型的解释工作,我们从神经网络的训练数据溯源和代码样本表征入手来分析“一个模型到底是如何归纳自己的数据的”,并通过发现意料之外的归纳现象来重新调整训练模型以达到更好的预测效果;本报告的后半部介绍用来解释的模型设计,我们认为决策系统在设计时应当考虑解释生成本身。我们将介绍一个基于语言模型的日志异常检测工作。在这个工作中,我们通过结合程序分析和语言模型,用一种演绎的设计方式来统一异常检测和异常解释两个问题。该方法不仅有助于提高异常检测的准确率,同时也能够方便快速调试检测系统本身。
报告****人
林云,上海交通大学计算机系副教授,系主任助理,博士生导师,原新加坡国立大学助理教授(研究岗),入选2021年国家海外高层次青年人才计划。2015年毕业于复旦大学计算机学院获得博士学位。主要研究领域为软件工程,侧重代码、网页和AI模型的自动分析技术。目前的研究工作包括代码自动调试与测试、模型训练的可视化解释、恶意网页检测、基于大语言模型的代码编辑与生成等。在ICSE、FSE、USENIX Security、 NeurIPS、AAAI、IJCAI、KDD等领域相关的国际顶级会议和期刊发表论文近50余篇。担任PRDC2023国际会议程序委员会联合主席,以及ICSE、FSE、USENIX Security、ICML、NeurIPS等重要国际会议的程序委员会委员。主持国家基金委海外优青项目。获得过ICSE2018最佳论文奖。
时间安排
❖
时间:2024年7月30日(周二)上午10:30-11:30
❖
线下地点:复旦大学江湾校区二号交叉学科楼A2003
❖
腾讯会议链接:
https://meeting.tencent.com/dm/NwIpBAh5KPp2
会议号:533 436 701
密码:711377