清华姚班学霸姚顺雨,官宣加入了OpenAI。
而就是这么一则简短的新闻,却引来了圈内众人的围观和祝福,来感受一下这个feel:
其中不乏像OpenAI前沿研究主管、美国IOI教练Mark Chen,以及AI领域的教授、投资人等等。
那么这位姚顺雨,到底为何能够引来云云关注?
从他过往的履向来看,我们可以提炼出这样几个要害词:
清华姚班
姚班联席会主席
清华大学学生说唱社团结首创人
普林斯顿盘算机博士
但除了较为亮点的履历之外,真正让姚顺雨步入民众的视野,照样由于他的多项科研功效:
头脑树(Tree of Thoughts):让LLM频频思索,大幅提高推理能力。
SWE-bench:一个大模子能力评估数据集。
SWE-agent:一个开源AI程序员。
绝不夸张的说,险些每项研究都在圈里发生了不小的涟漪;而且异常显著的一点是,它们都是深深围绕着大模子而睁开。
这或许也正应了姚顺雨此次官宣里的一句话:
是时刻将研究愿景转变为现实了。
至于这个“研究愿景”,我们继续深入领会一下。
研究要害词:Language Agents
若是纵观姚顺雨的主页,尤其是论文研究部门,就不难发现有一个出镜频率极高的词组——Language Agents。
包罗在他X主页中的简介,*句话上来也是Language Agents:
而这,也正是他博士结业论文的问题:Language Agents: From Next-Token Prediction to Digital Automation。
Language Agents,即语言智能体,是姚顺雨提出来了一种新的智能体种别。
和传统智能体差其余是,这种方式是将语言模子用于智能体的推理和行动,主打一个让它们实现数字自动化(Digital Automation)。
至于详细的实现方式,则有三个要害手艺(均有自力的论文),它们划分是:
ReAct:一种将推理和行动相连系的方式,通过语言模子天生推理轨迹和行动,来解决种种语言推理和决议义务。
头脑树:一种基于树搜索的方式,通过天生和评估多个头脑路径来解决庞大问题,提高语言模子的推理能力。
CoALA:一个看法框架,用于组织和设计语言署理,包罗内存、行动空间和决议制订等方面。
以ReAct为例,研究是将语言模子的动作空间扩充为动作集和语言空间的并集。
语言空间中的动作(即头脑或推理轨迹)不影响外部环境,但能通过对当前上下文的推理来更新上下文,可以支持未来的推理或行动。
例如在下图展示的对话中,接纳ReAct的方式,可以指导智能体把“发生想法→接纳行动→考察效果”这个历程举行循环。
云云一来,便可以连系推理的轨迹和操作,允许模子举行动态的推理,让智能体的决媾和最终效果变得更优。
若是把ReAct的方式归结为让智能体“reason to act”,那么下一个方式,即头脑树,则重在让智能体“reason to plan”。
头脑树是把问题示意为在树结构上的搜索,每个节点是一个状态,代表部剖析决方案,分支对应于修改状态的操作。
它主要涉及四个问题:
头脑剖析:将庞大问题剖析为一系列中央步骤,每个步骤都可以看作是树的一个节点。
头脑天生:行使语言模子天生每个节点的潜在头脑,这些头脑是解决问题的中央步骤或战略。
状态评估:通过语言模子对每个节点的状态举行评估,判断其在解决问题中的希望和潜力。
搜索算法:接纳差其余搜索算法(如广度优先搜索 BFS 或深度优先搜索 DFS)来探索头脑树,找到*的解决方案。
将头脑树应用到“24点”游戏中,与此前的头脑链(CoT)相比,准确率有了显著提高。
至于Language Agents中的最后一个要害手艺,即CoALA,则是一种用于组织和设计语言智能体的看法框架。
从下面的结构图来看,它大致分为信息存储、行动空间和决议制订三大模块。
信息存储是指语言智能体将信息存储在多个内存模块中,包罗短期事情影象和耐久影象(如语义影象、情景影象和程序影象)。
这些内存模块用于存储差异类型的信息,如感知输入、知识、履历等,并在智能体的决议历程中施展作用。
除此之外,CoALA 将智能体的行动空间分为外部行动和内部行动;外部行动涉及与外部环境的交互,如控制机械人、与人类交流或在数字环境中执行操作。
内部行动则与智能体的内部状态和影象交互,包罗推理、检索和学习等操作。
最终,语言智能体会通过决议制订历程选摘要执行的行动;而这个历程也是会凭证种种因素、反馈,从中找出*解。
Biotech创始人,在无止境的马拉松途中行走
除此之外,另有像开源AI程序员的事情SWE-agent等,也在圈里普遍流传。
但我们从姚顺雨众多的科研课题中,除了Language Agents之外,还能看到他所追求的另一个要害词——盘算的头脑。
而这一点,其着实他念本科的时刻便已经有所透露。
在即将奔赴普林斯顿大学攻读盘算机博士学位前,作为2015级学长,姚顺雨曾在清华2019年各种型自主选拔复试的开营仪式上向复试考生分享了本人在清华的学习发展履历。
相关内容纪录在他自己写的名为“你在清华姚班学到了什么?姚顺雨:足以改变天下”的文章中。
那时他从理论和实践两方面重点分享了盘算的头脑,并透露以为四年下来,*的收获就是盘算的头脑:
从理论上我们现在看到许多不能能做到的事情。所谓理论指导实践,我以为更多的是说,我们得从一个高度明白一个系统的能力极限和事情难易,然后再选择能做的、有意义的事情去做。
和阳光爽朗大男孩tag锁死,姚顺雨还分享了因清华南方浸润设计项目,前往阿根廷的履历:
我遇到了一群阿根廷的孩子……英语并不是天下通用的,阿根廷人说西班牙语。我曾经试图学西班牙语,然则我放弃了,由于我学盘算机,我拿出了谷歌翻译。我跟他们说北京的故宫和长城……
在他看来,这个时代,盘算能和任何学科相连系,而天下很大,在清华可以做你想做的事。
说完姚顺雨,姚班另有哪些人在搞大模子?
爆火的大模子,姚班另有谁在搞?
不得不提的有马腾宇和陈丹琦。
俩人昔时是同班同砚,清华姚班2008级校友,而且之后都拿了具有“诺奖风向标”之称的斯隆奖。
马腾宇博士就读于普林斯顿大学,导师是理论盘算机科学家、两届哥德尔奖得主Sanjeev Arora教授。
博士结业后,MIT、哈佛、斯坦福等*高校都给了他助理教授的Offer,马腾宇最终选择了斯坦福。
去年年底,马腾宇还正式宣布大模子创业了——确立Voyage AI,透露将带队打造现在*的嵌入模子,还会提供专注于某个领域或企业的定制化模子。
斯坦福人工智能实验室主任Christopher Manning、AI领域著名华人学者李飞飞等三名教授担任Voyage AI的学术照料。
陈丹琦这边,清华姚班完成本科学业后,2018年又在斯坦福大学拿下博士学位,主攻NLP,最终成为普林斯顿大学盘算机科学系助理教授、普林斯顿语言与智能项目副主任,配合向导普林斯顿NLP小组。
其小我私人主页显示,“这些天主要被开发大模子吸引”,正在研究主题包罗:
检索若何在下一代模子中施展主要作用,提高真实性、顺应性、可注释性和可信度。
大模子的低成本训练和部署,改善训练方式、数据治理、模子压缩和下游义务顺应优化。
还对真正增进对当前大模子功效和局限性明白的事情绪兴趣,无论在履历上照样理论上。
陈丹琦团队的大模子事情,量子位也有连续关注。
好比,提出的大模子降本大法——数据选择算法LESS, 只筛选出与义务最相关5%数据来举行指令微调,效果比用整个数据集还要好。
而指令微调正是让基础模子成为类ChatGPT助手模子的要害一步。
提出爆火的“羊驼剪毛”大法——LLM-Shearing大模子剪枝法,只用3%的盘算量、5%的成本取得SOTA,统治了1B-3B规模的开源大模子。
除了这两位,业界、学术界姚班校友在搞大模子的另有许多。
之前火爆全网的大模子原生应用《完蛋!我被大模子笼罩了》及其续作《我把大模子玩坏了》,就是由姚班学霸带队开发的。
游戏作者范浩强,旷视6号员工。昔时以IOI金牌、保送清华姚班、高二实习等传奇事迹被誉为天才少年。现在他已是旷视科技研究总司理,谷歌学术h-index 32的行业大佬。
马斯克xAI*研究功效——Tensor Programs VI,配合一作中也有姚班校友的身影。
Tensor Programs VI是xAI首创成员、丘成桐学生杨格(Greg Yang)之前Tensor Programs系列事情的延续,论文重点探讨了“若何训练无限深度网络”。
听说Tensor Programs相关功效,在GPT-4中已有应用。为解读论文,杨格本人那时还专门在X上举行了一场直播分享。
配合一作Dingli Yu,本科结业于清华姚班,现在Dingli Yu也快要在普林斯顿盘算机科学系博士结业了。
另有许多许多…………
说回这次姚顺雨被挖到OpenAI,OpenAI这边的招聘动作还在继续。
OpenAI工程师Karina Nguyen宣布最新招聘帖:
OpenAI模子行为团队招人啦!这是一个集设计工程与训练后研究于一体的梦想职位,也是天下上最有数的事情️
我们使用诸如RLHF/RLAIF等对齐方式界说模子焦点行为,以体现基本价值观并提升AGI的缔造性智能。通过这些功效,我们与产物 模子设计及工程团队配合开创AI界面和交互新模式,这将影响数百万用户……
有意思的是,Karina Nguyen实在之前是Anthropic AI(Claude团队)研究员,去年五月还和头脑链“开山论文”一作、OpenAI的Jason Wei一同在X(原Twitter)上举行提醒词决战。
没想到Karina Nguyen这么快就跳槽到了OpenAI……
顺便提一嘴,就在昨天有新闻爆料,谷歌DeepMind研究员Thibault Sottiaux也被挖到了OpenAI。
要知道,Thibault Sottiaux在Gemini初代和Gemini 1.5等论文中都是焦点孝顺者。
由此可见大模子赛道现在火爆水平,各家抢赛道的抢赛道,抢人的抢人。
One More Thing
跟姚顺雨同年从清华结业的,另有2位姚顺yu!
清华大学官方在2019年三位姚顺yu结业时,发了一条微博,还晒了三人的合照。
除了现已加入OpenAI的姚顺雨,另有一个姚顺雨是来自人文学院日语专业的一位女生。
另一位姚顺yu是姚顺宇,来自物理系,他是2018年本科生特奖得主,本科时代就以*作者在物理顶刊PRL(Physical Review Letters)上揭晓论文两篇、PRB(Physical Review B)一篇。
参考链接:
[1]
[2]
[3]
[4]