**2024 CCF 青年精英大会(YEF2024)将于2024年5月16-18日在宁波市海曙区召开。**YEF2024以“智启新局”为主题,邀请国内外来自高校、科研单位、大型 IT 企业的著名专家作高水平的学术、技术报告,组织畅想未来的“思想秀”和展现优秀大学生风采的“大学生学术秀”,并推出系列前沿观点论坛和技术论坛。
CCF YEF 是由中国计算机学会(CCF)主办的面向计算领域青年精英的年度综合性会议,创办于2011年,每年一届,至今已成功举办十三届,是计算领域学术界、企业界最富有影响力的以青年人为主的年度跨界学术、技术交流大会。
**小米作为全球前三的手机品牌,非常关注 AI Agent 方向的研究和应用。**我们认为随着大语言模型在人工智能领域的快速发展,基于大模型的 Agent 已成为推动 AI 技术革命的关键力量,AI Agent 代表能够自主理解指令、管理记忆、感知环境、制定规划、最终执行决策的智能体。手机作为个人计算中心,和 AI Agent 的组合是天作之合,以 AI Agent 为核心的手机操作系统未来可以给用户提供更智能化、省心省力和个性化的服务,提升用户工作生活的效率与质量。
为了更好的连接学术界和产业界,促进 AI Agent 方向的研究,小米大模型算法负责人刘伟作为执行主席在 YEF2024大会上,组织了主题为 “大模型时代 AI Agent 的挑战、优化与落地之道” 的技术论坛,邀请众多学界和业界的专家与技术领袖,分享 AI Agent 的前沿技术进展和行业应用。报告议题计划涵盖 AI Agent 的通用技术前沿,以及 AI Agent 在智能终端、游戏、巡检机器人等领域的应用、技术挑战和未来,探讨 AI Agent 发展的关键前沿问题。小米大模型团队在 AI Agent 方向开展了多项研究,包括规划、推理、benchmark 等方面,并取得了不错的进展。刘伟将做主题为“LLM as OS:智能手机+AI Agent 的行业思考与技术挑战”的技术报告,分享小米的思考和技术成果。此外,小米大模型团队负责人栾剑将参加论坛 panel 环节的讨论,和嘉宾一起讨论 AI Agent 行业落地面临的真实问题和技术挑战,以及趋势和未来,为下一步学术研究指引清晰的方向。
欢迎大家关注5月16日的“大模型时代 AI Agent 的挑战、优化与落地之道”技术论坛,并参与讨论。
论坛安排
顺序
主题
主讲嘉宾
单位
1
基于大语言模型的工具学习
高莘
电子科技大学
2
大语言模型驱动的游戏智能体
张海峰
中国科学院自动化研究所
3
LLM as OS:智能手机+AI Agent的行业思考与技术挑战
刘伟
小米
4
面向软件交互自动化的大模型智能体
李元春
清华大学
5
大模型驱动的智能巡检机器人:行业思考和技术挑战
盛兴东
联想
6
Panel环节
李元春
清华大学
张海峰
中国科学院自动化研究所
栾剑
小米
高莘
电子科技大学
盛兴东
联想
执行主席
刘伟
小米大模型算法负责人
CCF YOCSEF 总部候任 AC,北京大学心理与认知科学学院硕士行业导师,清华大学机器学习课程答辩导师,微软小冰初创成员。研究方向:人机对话和大语言模型。有超过10年的人机对话从业经历,主导和深度参与了微软小冰、小爱同学等业界具有影响力的人机对话产品的研发,获23年小米百万美金技术大奖,并有十数项专利和自然语言处理顶会论文发表。
共同执行主席
严睿
中国人民大学副教授
入选国家级青年人才计划,入选微软铸星学者,智源人工智能研究院智源青年科学家,中国人民大学杰出学者,担任多个国际重要学术会议的领域主席(Area Chair)和资深评审人(Senior PC),担任自然语言处理重要评审平台 ACL Rolling Review 的执行编辑(Action Editor)。在国际重要的期刊会议上发表论文150余篇,其中以第一作者或通讯作者发表 CCF A类论文100余篇,累计同行引用12000余次。
论坛讲者
李元春
清华大学智能产业研究院助理研究员
曾任微软亚洲研究院主管研究员和卡内基梅隆大学访问学者。主要研究方向为移动与边缘智能、系统软件等,主持和参与国家自然科学基金、科技部重点研发等项目多项,在高水平会议及期刊如 MobiCom, MobiSys, UbiComp, ICSE, FSE, ICLR 等上发表论文50余篇,研究工作获得 UbiComp 最佳论文提名奖、IS-EUD 最佳论文奖、GreenCom 最佳论文奖等奖项,相关系统和工具在开源平台上被广泛应用。
报告题目:面向软件交互自动化的大模型智能体
摘要:
每一代伟大的智能终端产品的出现几乎都伴随着交互技术的变革,在大模型时代,机器对于自然语言的理解和生成能力达到了空前的高度,有望为智能终端带来新一轮的交互方式革新,其中,基于自然语言的智能终端自动化操控是最直接、最有前景的技术之一。然而,将大模型直接应用于交互界面的自动理解和控制往往并不有效,由于模型本身有限的领域知识、幻觉和终端应用交互的复杂性,实现可靠高效的自动化操控仍有较大难度。本报告将总结这一方向上若干技术路线和关键的技术挑战,包括交互界面的表示、交互知识的获取、以及交互领域大模型的定制等,并探讨可能的解决方案。
张海峰
中国科学院自动化研究所副研究员
CCF 计算经济学专业组常务委员,中国科学院自动化研究所群体决策智能团队负责人。于北京大学计算机系获得本科、博士学位,曾在英国伦敦大学学院(UCL)从事博士后研究工作。致力于多智能体和强化学习的学术研究和平台研发工作,相关论文发表在 ICML、IJCAI、AAAI、AAMAS、《软件学报》等国内外知名学术会议、期刊,主持研发中科院自动化所“及第”智能体博弈平台(www.jidiai.cn),承担国家自然科学基金、科技部“新一代人工智能”重大项目、中国科学院先导A类项目等多项课题,所做研究应用于博弈智能体、油气产业链调度、铁路运行图调整等多个领域。
报告题目:大语言模型驱动的游戏智能体
摘要:
游戏智能体是人工智能发展的一条重要线索。大语言模型的出现,为游戏智能体的构建提供了一条新的思路。以大语言模型为基座,在其上嫁接专用博弈策略,可以较低成本地构建具备一定能力的游戏智能体。该方法在星际争霸、谷歌足球、我的世界等游戏场景下得到了初步验证,未来有望在更多游戏和现实博弈场景中应用。
高莘
电子科技大学助理教授、研究员
主要研究方向为预训练语言模型、大模型智能体和工具学习;在国际顶级会议期刊发表文章40余篇;目前担任中国中文信息学会青年工作委员会委员、信息检索专委会通讯委员,担任若干顶级会议的领域主席和高级程序委员会委员。
报告题目:基于大语言模型的工具学习
摘要:
基于大规模语言模型的智能体研究是近期自然语言处理领域中一个新兴的研究方向,该领域的研究也推动了通用人工智能的进一步发展。本报告将围绕语言模型智能体的工具调用能力构建展开,探讨语言模型智能体工具使用基础能力的构建方法以及如何将其应用在更多的下游任务上。
刘伟
小米大模型算法负责人
报告题目:LLM as OS:智能手机+AI Agent的行业思考与技术挑战
摘要:
以 ChatGPT 为代表的大语言模型引爆了当前人工智能界,不仅仅引起了学术机构的重视,企业和投资圈也积极跟进。本次分享首先从产业的视角讨论小米为代表的科技公司为什么重视大语言模型的研究,然后探讨大模型驱动的 AI Agent 和智能手机结合的未来应用、技术挑战和解决方案。
盛兴东
联想研究院上海分院算法总监
联想研究院上海分院算法总监,主任研究员(Principal Researcher),拥有15年计算机视觉和人工智能算法研发经验,在 SLAM,三维重建,缺陷检测等多个计算机视觉算法领域具有丰富的产品和工程经验,现任上海图像图形学会理事,申请相关发明专利50余项。
报告题目:大模型驱动的智能巡检机器人:行业思考和技术挑战
摘要:
探讨具身智能巡检机器人面临的在感知、控制、规划等方面的挑战及基于大模型的潜在的解决方案,分享通过视觉大模型提升机器人环境感知能力的实践经验。
栾剑
小米大模型团队负责人
曾长期任职东芝、微软,主要从事语音、语言方向的技术研究和应用。在担任微软小冰首席语音科学家期间主导研发了业内首个歌唱合成软件 X-Studio,来小米后领导团队先后完成了超级拟人语音合成系统、小爱翻译离线字幕、小米自研大模型 MiLM 等多个重量级项目研发和落地。在国际顶级学术会议和杂志发表论文30余篇,拥有国内外发明专利60余项。