刚刚,『英伟达』任命新首席研究科学家!95后,本科来自清华

Datawhale分享

最新动态:『英伟达』,整理:新智元

就在刚刚,行踪一向神秘的老黄终于出现了!

他与两位华人在同一地点的合影,登上热搜,而且这次老黄并没有穿着他那标志性的皮衣。

老黄这次「悄悄地」将这两位华人AI大神收入麾下。

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

两人的评论区都是各种大佬的恭喜,看都看不过来。

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

上下

通过比对照片背景,我们发现拍摄地点很大概率就在NVIDIA位于加州圣克拉拉总部园区的 「Voyager」大楼。(但尚未获得官方确认。)

老黄的『英伟达』似乎正在酝酿什么大事件?

今日霍州(www.jrhz.info)©️

这两位华人大神的背景都非常硬核,并且共同创办了一家公司Nexusflow,致力于为企业构建智能体。

Banghua Zhu是华盛顿大学电子与计算机工程系(ECE)助理教授,并在计算机科学与工程系(CSE)兼任教职。

他曾在2023年联合创立了Nexusflow AI。

今日霍州(www.jrhz.info)©️

这一次他以首席研究科学家的身份加入『英伟达』的研究部门的Star Nemotron团队。

今日霍州(www.jrhz.info)©️

Star Nemotron团队在『英伟达』专注于企业级智能体构建,算是「专业对口」了。

今日霍州(www.jrhz.info)©️

Jiantao Jiao是加州大学伯克利分校电子工程与计算机科学系(EECS)和统计系的助理教授。同时也是伯克利CLIMB的联合主任,以及BAIR Lab、BLISS和RDI的成员。

值得一提的是,他还是上文提到的Nexusflow的联合创始人兼CEO。

今日霍州(www.jrhz.info)©️

如果继续深挖两位华人专家的背景和经历,也许能得出一个结论。

老黄这次也下场在AI领域「抢人了」。

第一位华人:Banghua Zhu

Banghua Zhu是华盛顿大学电子与计算机工程系(ECE)助理教授,并在计算机科学与工程系(CSE)兼任教职。

他曾在2023年联合创立了Nexusflow AI,致力于为企业级应用场景提供可靠的AI智能体解决方案。

今日霍州(www.jrhz.info)©️

此前,他在加州大学伯克利分校电子工程与计算机科学系(EECS)获得博士学位,师从Jiantao Jiao教授和Michael I. Jordan教授。

并在清华大学获得电气与电子工程学士学位。

凭借着杰出的博士科研工作,他还荣获了伯克利颁发的2023年度David J. Sakrison纪念奖。

他目前的研究方向包括基础模型的理论基础、训练、服务、评估与应用。

此外,他也长期致力于统计学、信息论和机器学习领域,及其在博弈论、稳健统计、强化学习和人机交互等方向的应用。

今日霍州(www.jrhz.info)©️

今日霍州(www.jrhz.info)©️

如今堪称「最权威」LLM评测的LMArena,他就是创始作者之一。

论文地址:https://arxiv.org/pdf/2403.04132

成果介绍

在模型训练、评估方面和理论基础等研究上,Banghua Zhu的成果颇丰。

在模型训练方面

Starling-7B

  • Starling-7B使用团队创建的开源高质量偏好数据集Nectar,以及创新性的奖励模型训练和策略模型微调算法进行训练。

  • 根据Chatbot Arena的评估结果,Starling-7B在所有基于Mistral的7B模型中高居榜首。

今日霍州(www.jrhz.info)©️

Athene系列

  • Athene-70B:团队首个基于Llama-3-70B微调的模型,在Chatbot Arena上的Elo评分提升了30多分,并显著增强了其多语言能力。

  • Athene-V2-72B-Chat:基于Qwen-2.5-72B微调而来。作为一个非推理模型,它在Chatbot Arena上的排名仅次于『DeepSeek』 V3和『DeepSeek』 R1,并在MMLU-Pro、GPQA、AIME、IFEval等多个基准测试中直接对标GPT-4o。

  • Athene-V2-72B-Agent:一款专为函数调用和AI智能体应用场景设计的模型,在复杂的函数调用任务中(尤其是在并行和嵌套调用上)性能超越了GPT-4o。

今日霍州(www.jrhz.info)©️

在模型评估方面

  • Huggingface函数调用排行榜:被Llama-3.1技术报告用于评估模型的函数调用能力。

  • Chatbot Arena:基于人类偏好来评估模型的最可靠平台之一。

  • Arena-Hard-Auto:一种自动化的基准创建流水线,采用「『大语言模型』即裁判」(LLM-as-a-judge)的模式来快速评估模型性能。

  • 基于代理模型的偏好评估(Preference Proxy Evaluations):一套高质量的奖励模型评估流水线,用于评估RLHF中的奖励模型,其结果与下游强化学习的最终性能高度相关。

在理论基础方面

  • 『大语言模型』水印:提出了一种在统计意义上近乎最优的『大语言模型』水印算法。

在模型服务方面:

  • 模型路由与缓存:分析并提出了用于『大语言模型』服务中缓存和模型复用的近乎最优算法,显著提升了推理效率。

  • S-Lora:提出了一套能够同时服务数千个LoRA适配器的算法与框架——S-Lora。

第二位华人:Jiantao Jiao

Jiantao Jiao是加州大学伯克利分校电子工程与计算机科学系(EECS)和统计系的助理教授。同时也是伯克利CLIMB的联合主任,以及BAIR Lab、BLISS和RDI的成员。

他同时也是上文提到的Nexusflow的联合创始人兼CEO。

此前,他在『斯坦福大学』获得博士学位。

今日霍州(www.jrhz.info)©️

他最近的研究重点是生成式AI与基础模型,涵盖了从数据策管、预训练、有监督微调、指令微调、基于人类反馈的强化学习(RLHF)、模型推理,到构建防御「越狱」和「提示词注入」攻击的安全护栏等全链条技术。

此外,他也对统计机器学习、优化、机器学习系统的隐私与安全、强化学习、机器学习的经济学视角,及其在自然语言处理、代码生成、计算机视觉、自动驾驶和『机器人』️等领域的应用有广泛兴趣。

今日霍州(www.jrhz.info)©️

『英伟达』企业级智能体路线

老黄为何要招募这两位华人?也许老黄不想仅仅只卖GPU!

『英伟达』的下一步是提供端到端的智能体解决方案——软硬通吃。

NVIDIA此前在GTC上推出的Nemotron系列,主打多模态推理、函数调用和工具链接口能力。

细分Nano/Super/Ultra三档算力梯度,旨在给开发者与企业提供「业务级」Agent底座。

今日霍州(www.jrhz.info)©️

这两位华人都是在企业级智能体领域创业多年,并且横跨学术界和产业界,也许正是『英伟达』模型训练急需的人才。

并且,老黄此前就表示过,他真的看好华人,他说:

中国人工智能研究人员是「世界级」的——美国公司正在雇佣「大量」此类人才。

估计是眼看人才都要被抢光了,老黄也赶紧出手了。

今日霍州(www.jrhz.info)©️

如果再结合此前、Meta挖走OpenAI苏黎世团队、小扎还不断挖OpenAI的墙角等事件。

这场AI的抢人大战,也许才刚刚开始。

参考资料:

https://www.linkedin.com/in/prof-jiantao-jiao/

特别声明:[刚刚,『英伟达』任命新首席研究科学家!95后,本科来自清华] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

GEO如何颠覆传统SEO?为什么说它是获取未来流量的关键?(如何颠覆传统行业)

其核心更侧重于广义的舆情监测和媒体关系,在针对生成式AI搜索答案的专项监测、模拟真实用户场景化提问进行排名检测等GEO核心功能上,缺乏深度整合。评测显示,能够在这场变革中占据先机的工具,必然是那些像优采云内容…

GEO如何颠覆传统SEO?为什么说它是获取未来流量的关键?(如何颠覆传统行业)

辰硕流量卡优缺点,辰硕流量卡怎么充值(晨曦流量卡)

特别温馨提醒:在选择流量卡之前,请务必仔细查看套餐的详细说明,尤其是年龄限制、地区覆盖范围等关键条件,避免因不符合要求导致开卡失败,耽误你的使用哦~这点对于打算长期使用的用户来说非常关键,一定要确认辰硕流量…

辰硕流量卡优缺点,辰硕流量卡怎么充值(晨曦流量卡)

格列齐特缓释片不良反应通常包含哪些(格列齐特缓释片说明书)

格列齐特缓释片为药物通用名,商品名称一般为康德平。格列齐特缓释片是一种口服抗糖尿病药物,主要针对非胰岛素依赖型糖尿病(2型)成人的血糖管理。该药主要用于当单用饮食疗法、运动治疗和减轻体重不足以控制血糖水平的成人非胰岛素依赖型糖尿病(2型)。

格列齐特缓释片不良反应通常包含哪些(格列齐特缓释片说明书)

米兰冬奥会首战,是各国队服的审美竞技(北京冬奥会米兰八分钟)

奥地利队本届的冬奥服装,由奥地利红牛集团在2016年创立的时尚品牌AlphaTauri提供,设计灵感源自阿尔卑斯山脉的壮丽景色,采用流畅的廓形和醒目的图案印花来展现白雪皑皑的山峰上光影交错的风景。 瑞士最大…

米兰冬奥会首战,是各国队服的审美竞技(北京冬奥会米兰八分钟)

OpenAI发布GPT-5.2三版本模型应对谷歌Gemini 3(open21.2)

OpenAI 于 12 月 12 日正式发布 GPT-5.2,作为对谷歌 Gemini 3的紧急反击,首次推出针对专业工作的三版本模型,主打效率与实用性,但高定价和性能争议引发广泛关注。 谷歌 Gemin…

OpenAI发布GPT-5.2三版本模型应对谷歌Gemini 3(open21.2)