腾讯研究院AI速递 20250928(腾讯研究院在哪儿)

生成式AI

一、 ChatGPT新功能Pulse览版,GPT-5主动给你推消息

1. OpenAI推出ChatGPT新功能"Pulse"预览版,首先向Pro用户开放,每晚根据用户聊天记录和反馈提供个性化内容推送;

2. 该功能是基于智能体(Agent)开发的,能主动进行异步搜索,支持链接Gmail和Google日历以提供更相关建议;

3. Pulse通过主题卡片形式呈现内容,用户可以点赞或踩赞提供反馈,奥特曼称这是"将ChatGPT从完全被动转变为主动,提供高度个性化服务"的第一步。

二、 『明星』️创业公司Thinking Machines,第二篇研究论文出炉

1. 估值840亿元的Thinking Machines发布第二篇研究论文"Modular Manifolds",通过让网络的不同层在统一框架下进行约束和优化,提升训练稳定性和效率;

2. 研究者Jeremy Bernstein提出模块化流形方法,解决神经网络训练中权重数值过大或过小导致的不稳定问题,并提供详细的理论分析与实验验证;

3. 公司创始人Mira Murati与翁荔等纷纷转发支持,此前该公司已发布了首篇研究《Defeating Nondeterminism in LLM Inference》,专注解决大模型推理中的不确定性问题。

三、 谷歌发布Gemini Robotics 1.5,让『机器人』️学会「思考」

1. 谷歌DeepMind发布针对『机器人』️和具身智能的Gemini Robotics 1.5系列家族模型,包括Gemini Robotics 1.5和Gemini Robotics-ER 1.5两款模型;

2. Gemini Robotics 1.5是最先进的视觉-语言-行动模型,能将视觉信息和指令转化为『机器人』️动作;Gemini Robotics-ER 1.5是最强大的视觉-语言模型,能推理物理世界并创建多步骤计划;

3. 两款模型协同工作,可让『机器人』️执行垃圾分类、行李打包等复杂任务,支持"思考后行动",实现跨不同『机器人』️形态的技能迁移与泛化学习。

四、 实测Kimi全新Agent模型「OK Computer」,很OK

1. Kimi推出全新Agent模型"OK Computer",依托Kimi K2,能完成网站搭建、PPT制作和百万行数据处理等复杂任务;

2. 模型操作时会列出Todo List进度表,自主完成网页搜索、素材生成、代码编写与检查,最终输出可交互、可复用的结果;

3. 设计类任务能自主规划并实现各模块功能,分析类任务能自动搜集数据并提供可视化图表,生成类任务支持多种内容输出与编辑。

五、 业界首个高质量原生3D组件生成模型,来自腾讯混元

1. 腾讯混元3D团队推出业界首个原生3D组件生成模型Hunyuan3D-Part,包含P3-SAM(3D分割)和X-Part(组件生成)两大模块;

2. 该模型能生成高质量、可投入生产和结构合理的组件式3D内容,解决游戏制作与3D打印行业对可分解3D形状的需求;

3. 模型从语义特征和边界框检测到部件生成全流程优化,在PartObj-Tiny等多个基准上大幅超越现有工作,已开源且提供线上体验入口。

六、 五部短片亮相釜山电影节,AI真的能「拍」好电影吗?

1. 香港动画公司ManyMany Creations制作的15分钟全AI短片《九宵》成功入选釜山国际电影节"未来影像"AI电影国际峰会;

2. 该峰会还展映了《权利游戏》《法体》等四部AI短片,这些作品不再只是技术展示,而是真正利用AI作为叙事手段,探讨女性♀️主义、"平庸之恶"等社会主题;

3. 博纳影业已成立国内首个AI制作中心,利用AI将电影制作周期从数年压缩至1.5-2年,并大幅降低成本。

七、 iOS 26.1 隐藏彩蛋,给 ChatGPT 们造了个新「C 口」

1. iOS 26.1、iPadOS 26.1和macOS Tahoe 26.1开发者测试版代码显示,苹果正在为App Intents引入MCP支持,将允许ChatGPT、Claude等AI模型直接与苹果设备应用交互;

2. MCP(模型上下文协议)由Anthropic提出,作为AI领域的"通用插口",能让模型与外部服务安全对话,已被Notion、Google、Figma、OpenAI等采用;

3. 苹果不让每个应用单独支持MCP,而是构建系统级支持,既能利用行业生态,又能强制执行隐私安全标准,体现苹果从"全栈自研"向平台化的战略转变。

前沿科技

八、 Project Imaging-X,1000+开放医学影像数据集综述

1. 上海人工智能实验室等机构联合发起Project Imaging-X,系统梳理2000-2025年间1000+医学影像数据集,揭示医学数据"小而散、偏科严重"的格局;

2. 研究显示医学影像数据与通用视觉存在数量级差距,病理数据超过其他类型,而分类与分割任务占主导,CT和MRI为主要3D数据类型;

3. 项目提出元数据驱动融合范式(MDFP),通过元数据统一、语义对齐、融合蓝图和索引共享四阶段流程,实现数据集整合,已开发交互式数据发现门户助力医学基础模型发展。

报告观点

九、 红杉:AI的生产力悖论,仅5%公司正在从AI中获益

1. 红杉最新研究揭示"GenAI鸿沟":仅5%公司从AI获得显著价值,95%因静态工具与流程脱节而未能受益,核心问题是AI系统"学不会、推不开、用不深";

2. 研究指出企业AI失败的三大原因:AI工具缺乏从用户反馈中学习的能力;95%的定制AI方案未能从试点扩展至规模化部署;员工转而使用个人AI服务形成"影子AI经济";

3. 22-25岁初级岗位已出现大规模替代,AI首先替代"书本知识",专家经验成为新护城河;创业者应打造能学习的AI代理,深度融入企业后台流程,按结果收费,帮助客户跨越生产力J曲线。

👇加入AGI数据库,AI智能问答

特别声明:[腾讯研究院AI速递 20250928(腾讯研究院在哪儿)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

长安CS35集雨板导流板适配方案大揭秘,2026车主必看!(长安cs35雨刮安装视频)

选择合适的长安CS35集雨板及相关配件对车辆外观及功能性至关重要。 本篇为你解析适配要求、功能特性及选购要点,助你轻松打造个性化的爱车。 选择适配长安CS35的集雨板导流板、端盖、前挡玻璃挡水侧盖板以及雨刮盖板时,关键在于找到符合车型设计且

长安CS35集雨板导流板适配方案大揭秘,2026车主必看!(长安cs35雨刮安装视频)

喝完酒第二天舌头麻的原因(喝完酒第二天舌头像烫过一样)

喝完酒第二天舌头麻可能与多种因素有关,包括酒精刺激、过敏反应、神经损伤、维生素缺乏或口腔疾病等。酒精代谢产物乙醛可能直接刺激舌黏膜,导致麻木感。部分人群对酒精或酒类添加剂过敏,饮酒后可能出现舌部感觉异常

喝完酒第二天舌头麻的原因(喝完酒第二天舌头像烫过一样)

2026年种花生,鲁花16抗旱高油品种适合吗?(2025年种花生时间)

鲁花16作为2026年的热门花生品种,备受农户关注。它抗旱性强、早熟高产、含油量高,特别适合北方干旱地区种植。本文为你详细解析鲁花16的种植优势、适用场景和常见误区,帮你做出更科学的决策。

2026年种花生,鲁花16抗旱高油品种适合吗?(2025年种花生时间)

AI闯入课堂,职校教学迎来“模式革命”(ai智能课堂怎么使用)

“分层”是将人工智能知识和技能切分为不同层次,“分类”针对不同学生程度、专业背景、岗位要求对课程知识的侧重,不仅符合人工智能知识结构,也服务于学生专业和发展志向,2023年,深职大转为职业本科,其“人工智能应…

AI闯入课堂,职校教学迎来“模式革命”(ai智能课堂怎么使用)

明道,从“偶像剧鼻祖”到“追光大叔”,他用20年跑完偶像剧男主动线

当台偶剧的热潮褪去,当昔日的搭档们纷纷转型,明道却选择了一条更为漫长的路——他没有停下奔跑的脚步,而是换了一种姿势,继续在『娱乐圈』️里追光。在节目中,他不再是那个高高在上的“霸道总裁”,而是一个为了舞台拼尽全力的…

明道,从“偶像剧鼻祖”到“追光大叔”,他用20年跑完偶像剧男主动线