在过去的两年里,大模型技术竞赛如火如荼。科技公司们纷纷投入生成式AI技术的研发,期望能将新的突破整合到他们的产品中。OpenAI作为一个非常成功的案例,吸引了研究员、工程师和投资人的广泛关注,也引发了大家的深入讨论:为什么OpenAI能取得如此成功?
OpenAI的成功不仅源自多年来对技术的坚定探索和持续的资金投入,更重要的是其吸引了一批顶尖的AI研究人员。从ChatGPT到Sora再到GPT-4o等划时代的产品背后,都有一长串核心贡献者的名单。
一家科技公司要想持续保持“伟大”,关键在于拥有优秀的技术人才。
回到国内,我们同样可以看到一群怀揣理想与热情的技术人才:有些人苦战数月,与团队合作打造出首个中文原生DiT架构文生成模型;有些人阅读最新的论文,不遗余力地将用户体验中的延迟从10毫秒降低到1毫秒;还有些人多年如一日地投身于科学大模型的研发,希望能揭示AI在解读生命奥秘方面的潜力;有人大胆突破,保卫刷掌安全。
「你们听到赛车发动机的声音了吗,轰隆隆!」
在一个小而神秘的团队里,Andrew沉浸在他的研究中,探索着人工智能与强化学习的奥秘。当大量数据正在喂给模型进行训练时,Andrew兴奋而又期待地喊出了这句话。
Andrew专注于强化学习和多智能体系统的研究,在高校实验室,那里的环境相对纯粹,团队时常集中力量攻克领域内的关键课题。对他们来说,游戏行业是一个理想的实验场所,提供了丰富的学习机会和挑战,这些游戏不仅具有反应迅速的实时设置,还面临着不断变化的目标和复杂的环境。
在这个动态而复杂的背景下,许多研究者像andrew一样,致力于打造更强大的AI智能体。他们的目标不仅仅是提高游戏的娱乐性,更是赋予整个系统更强的规划和解决问题的能力。
通过强化学习的方法,这些智能体能够不断学习和优化,逐步提升其在游戏中的表现和适应能力。
在实验室的闭门研究之外,他们将这些技术落地到实际的游戏环境中,面对现实世界中的挑战和限制。这种过程不仅是技术的演进,也是对理论和实践结合的持续探索,为游戏技术的未来发展开辟了新的可能性。
「AI的目标是让用户玩游戏的时候更快乐!」
来到腾讯后,Andrew从游戏玩家变成了帮助开发游戏的人。「粗略算来,60%的时间跟游戏本身的业务打交道,40%的时间在学习、应用新的游戏技术。」具体地说,他的工作任务是使用AI改善游戏体验。
通常来说,AI会被事先设置一个「奖惩机制」,然后自主进行玩法机制的探索和检查游戏功能是否有bug,有时候还能发现一些人类没挖掘到的「亮点」:比如哪种匹配方式更有利于获胜、哪里可以钻空子、哪里可以有无限资源。最终,这些发现都会被用来改进游戏体验。
与实验室不同的是,技术落地需要更多地考虑用户体验。比如,加入AI模型能力固然有好处,却会增加游戏安装包的体量,团队要考虑如何在极限条件下让模型高效运转,不然会带来高延迟、高耗能、占内存、手机发烫等问题。
当然在一个优秀人才集聚的地方,或多或少会有些「卷」。特别是与业务紧密相关的研究项目,会驱动人不停地思考和创造,既要熟悉游戏业务,也要追踪最新的AI技术。所以,每当有一篇重要的 AI 智能体新论文出现,内部团队都会马上坐下来认真讨论。
不遗余力地将用户体验中的延迟从10毫秒降低到1毫秒;还有些人多年如一日地投身于科学大模型的研发,希望能揭示AI在解读生命奥秘方面的潜力;有人大胆突破,保卫刷掌安全。
「我好像真的在做一件改变世界的事情」
2022年开始,生成式AI的爆发几乎颠覆了以往的研究思路,文生图成为了视觉领域的新热点。8年前以「大咖计划」身份入职的Q,现在就在负责腾讯混元大模型文生图的技术研究。
过去一年,混元大模型的文生图能力实现了「从无到有」,然后是更加「精准、美观」。这些突破的背后都是Q和团队成员的数月奋战,业内首个中文原生的 DiT 架构文生图模型「混元-DiT」,现已全面对外开源。
模型地址:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
技术报告地址:https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
混元-DiT的视觉生成效果对比前代混元文生图大模型提升超过20%。它支持中英文双语输入及理解,参数量 15 亿,不仅可以支持文生图,也可以作为视频等多模态视觉生成的基础。
「人生开了加速器」
对于Q个人来说,参与混元大模型项目就像是给自己的人生开了一台加速器。通过掌握这些先进技术,不仅能在各种场景中得到实际验证,还能开拓出全新的商业机会。这种经历让他深刻感受到,自己正身处一个能够改变世界的重要时刻。
「我选择在互联网企业搞科研」
技术研究领域的博士生,毕业前常会面临两个不同的选择:留在高校继续搞科研or去企业当码农,在yes or no之间,王艾文同学选择了&——在互联网企业搞科研。
听起来是不是不可思议,但是在鹅厂可以,王艾文读博时期学的是计算生物学,用大模型算法来研究一些生物学的未知问题。将AI技术应用于传统的科学领域是近年来一直在探索实践的课题,而今年王艾文参与的三项「蛋白质组」主题的研究相继登上国际顶级学术期刊,分别为解决蛋白组学中的数据库、AI 建模和AI辅助临床分析问题提出了极具前瞻性的研究方案。
「这份工作是有科学价值的」
王艾文来到鹅厂是缘分,也是内推。在鹅厂的朋友说这个岗位和他的专业匹配度99%,所以内推了王艾文。进来后发现,匹配度99.99%。科研很未知,有很多运气成分在,没办法短期内看到成果,但我进来后,团队会鼓励我安心去做研究,更大胆地探索。希望我能在这发一些有影响力的论文,参与几个重磅项目,能对社会和行业有一点点贡献。
对王艾文个人而言,最难得的是腾讯AI Lab提供了一种非常纯粹的研究环境。鹅厂用自己的优势去做研究,是希望能对外开放这些研究成果,便于行业和科学家能直接上手使用,这样他们就不需要花高成本重新训练模型。我们做的研究,发的论文也是开源的,希望未来能对临床应用有帮助,去帮人类解决一些癌症等疑难杂症。公司也愿意投入更多的资源去试错。
「爸妈知道我在研究掌纹,再多的就听不明白了」
Ruo的专业是AI安全算法研究,当采访时问到爸妈知不知道道你在鹅厂做什么的问题时,Ruo最后自信的说道「我相信等他们使用上我参与研发的产品之后,他们会很高兴」
Ruo刚进鹅厂就是负责刷掌的活体检测这个模块,这是一个新兴而颇具挑战的问题。用刷掌方式去做身份核实是一个很新的领域。为了保障刷掌安全,防止有人用假手掌(纸片、建模手掌等)去欺骗识别系统,我们团队在不断探索最新的技术去防护。
刷掌技术是一个具有未来想象力的研究方向,Ruo很荣幸能在早期就参与进来。也希望参与研发的产品,能在生活中广泛应用。
即使是新人,承担这些较为突破性的工作,大胆创新突破,团队给足能够试错的勇气,一些未知前沿发现也许就能冒出来。
这些技术大咖都来自腾讯「青云计划」,今年在新一届青云计划中特别强调:要加强大模型领域人才的招募,名额要比去年再增加50%。招募范围面向「全球顶尖学子」,提供的是「极具竞争力的薪酬」,还有定制化的培养方案、核心业务工作机会、前瞻性技术课题等极具吸引力的条件。
同时「青云计划」,还为技术人才们准备了多种定制化的培养方案,安排杰出科学家、技术高管直接担任成长导师,进行专场辅导。
鹅厂有丰富的落地应用场景、领先的产品及工程能力和充足的AI基础设施,能把大家过去和未来的潜力激发出来
本年度青云计划招募的范围包括AI大模型、基础设施/硬件、金融科技、存储/数据库、机器人、多媒体、游戏引擎、安全、量子、大数据共十大技术领域。特别是,加入腾讯青云计划的人才,将由腾讯首席科学家张正友和俞栋、吴石等杰出科学家担任导师。
报名候选人的毕业时间需符合和满足以下要求:
另外,预计从7月起,腾讯将组织多场青云技术沙龙活动&技术开放日,携手业务领军人、科学界学术大咖、腾讯技术大牛等共同探讨技术领域最前沿的话题,助力技术人才发展。
更多信息请查看:《腾讯2025青云计划全球启动》