腾讯研究院AI速递 20250731(腾讯研究中心)

生成式AI

一、 ChatGPT「学习模式」火爆上线,24小时的导师免费用

1. OpenAI上线ChatGPT新功能"学习模式",采用苏格拉底式逐步引导方式,帮助用户深入理解复杂概念;

2. 所有免费版、Plus版、专业版和团队版用户均可免费使用,功能包括交互式提示、分步解答和个性化支持;

3. 该模式背后的提示词被开发者Simon Willison发现并公开,系统会根据用户的教育背景和知识基础调整教学策略。

二、 Grok即将推出了「Imagine」视频功能,挑战谷歌Veo 3

1. 马斯克的xAI即将为Grok iOS应用推出全新图像视频生成功能"Imagine",支持带音频的视频生成,可一次性生成4段视频;

2. 实测效果逼真,细节丰富,支持多种风格生成,用户可通过语音或文字描述进行创作;

3. Imagine将拥有独立标签页,提供近乎实时的图像生成,并支持不同预设模式如Spicy、Fun和Normal,直接挑战谷歌的Veo 3。

三、 昆仑万维开源类GPT-4o多模态统一模型Skywork UniPic

1. 昆仑万维开源多模态统一模型Skywork UniPic,仅需1.5B参数即可实现与百亿参数专用模型相当的效果,在消费级显卡上流畅运行;

2. 模型采用自回归架构,在单一模型中实现图像理解、文生图和图像编辑三大能力深度融合,与GPT-4o的技术路线相似;

3. 通过高质量小数据训练、渐进式多任务训练策略和自研专用奖励模型,UniPic在GenEval和DPG-Bench等多个基准测试中达到行业SOTA水平。

四、 群核科技发布全球首个大规模3D语义数据集InteriorGS

1. 群核科技发布全球首个适用于智能体自由运动的大规模3D数据集InteriorGS,包含1000个精细的3D高斯语义场景,覆盖超过80种室内环境;

2. 数据集将3D高斯技术与自研空间大模型SpatialLM深度融合,打通"现实-虚拟-现实"闭环,使其成为具身智能领域的"ImageNet";

3. SpatialVerse平台已与谷歌、斯坦福、英特尔等多家机构合作,为智元『机器人』️等企业提供仿真数据训练,有望突破Sim2Real难题。

五、 消费级3D打印品牌拓竹,全面接入腾讯混元3D模型

1. 拓竹科技3D模型平台MakerWorld全面接入腾讯混元3D,预计月调用量将突破10万次;

2. 混元3D实现0.1毫米级高精度建模,几何分辨率达1024级,生成模型无需修复即可直接打印;

3. 支持文字图片输入快速生成,具备物理级材质建模能力,大幅降低3D建模门槛和设计周期。

六、 WPS 灵犀原生 Office 办公智能体, AI 办公另一种体验

1. WPS灵犀原生Office办公智能体实现了AI与办公软件的深度融合,能够一站式完成文案写作、PPT制作、文档阅读和数据分析等办公任务;

3. 除创作功能外,还提供AI搜索、知识库和AI聊文档等功能,支持随身语音助手,实现工作效率与创意质量的双重提升。

七、 『豆包』・图像编辑模型 SeedEdit 3.0,用对话框进行P图

1. 火山引擎发布『豆包』・图像编辑模型SeedEdit 3.0并上线火山方舟,主打指令遵循、主体保持和生成质量控制;

2. 模型支持通过自然语言指令进行消除、替换、风格转换等多种图像编辑操作,在文字修改、背景替换等场景的表现对标GPT-4o和Gemini 2.5 Pro;

3. 技术基于文生图模型Seedream 3.0,采用多阶段训练策略、自适应时间步采样等技术实现8倍推理加速,运行时长从64秒降至8秒。

八、 NotebookLM上线视频总览Video Overviews的新功能

1. Google更新AI笔记工具NotebookLM,推出"视频总览"(Video Overviews)功能,可将用户上传的笔记、PDF、图片自动生成结构清晰的视频;

2. 用户可根据学习主题、知识基础和学习目标定制视频内容,增强个性化学习体验;

3. 此功能已向所有英文用户开放,NotebookLM的Studio面板同步升级,支持在一个笔记本📓保存多版本输出,并新增四个快捷按钮对应音频、视频、思维导图和报告。

前沿科技

九、 理想发布会三小时背后的关键:VLA 司机大模型要上路了

1. 理想汽车随i8车型发布,推出业内首个量产VLA(视觉-语言-动作)司机大模型,8月将同步OTA推送至所有搭载Thor-U和Orin-X平台的AD Max车型;

2. VLA能力体现在能理解自然语言指令、根据过往记忆设定路段速度、复杂路况下判断风险,代表辅助驾驶从"模仿行为"进化到"理解意图";

3. 理想自动驾驶研发高级副总裁郎咸朋透露,VLA开发依靠12亿公里有效数据和13 EFLOPS训练平台,通过世界模型和仿真环境训练,将测试成本从每公里18元降至0.5元。

报告观点

十、 谷歌前CEO施密特:"开放权重"是中国AI发展迅速的关键

1. 前谷歌CEO施密特在WAIC大会上表示,中国AI技术在两年内取得巨大进步,包括『DeepSeek』、Mini Max、Kimi等大模型达到全球领先水平;

2. 中国与美国AI发展的最大区别在于中国采取"开放权重"策略,施密特认为这是推动中国AI快速发展的关键因素;

3. 施密特提倡加强中美AI合作,认为通过开放对话和建立信任,共同应对AI技术滥用风险,保障人类安全与尊严是双方共同目标。

👇加入AGI数据库,AI智能问答

特别声明:[腾讯研究院AI速递 20250731(腾讯研究中心)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

软性亲水接触镜是什么(软性亲水接触镜是什么材质)

软性亲水接触镜是一种由含水高分子材料制成的隐形眼镜👓,用于矫正屈光不正或治疗眼部疾病。这种镜片通过其中的水分保持柔软性和透氧性。 软性亲水接触镜的主要材料是甲基丙烯酸羟乙酯等亲水性聚合物,含水量通常在30%-80%之间

软性亲水接触镜是什么(软性亲水接触镜是什么材质)

还在傻傻手打身份证🪪号?教你3个“骚操作”,1秒提取关键信息(我还在傻傻的计划着将来是什么歌)

如果你的手头只有一两张身份证🪪照片需要处理,或者是在移动办公场景下,其实根本不需要下载任何额外的APP。 这个技巧的含金量在于,它不仅仅是识别文字,而是试图帮你“结构化”数据,对于财务和HR来说,这绝对是个冷…

还在傻傻手打身份证🪪号?教你3个“骚操作”,1秒提取关键信息(我还在傻傻的计划着将来是什么歌)

警方回应博主打假遭店主持刀驱赶 多方介入调查处理

12月10日,申先生在吉林公主岭打假时遭到一家店铺店主持刀追砍。他的衣服被划破,但人没有受伤,随后他拨打了报警电话。警方接到报警后已受案处理。记者多次尝试联系店主,但电话一直无人接听。公主岭市监局表示,市监部门已经介入调查此事

警方回应博主打假遭店主持刀驱赶 多方介入调查处理

模范的士3》收视飙破新高!由李帝勋打造的「道奇宇宙」全面升级:剧情揭露金义圣背后动人故事(模范出租车剧情介绍电视猫)

「模范的士」之所以三季都安全运行,就是因为有它的存在,他的副角色「道奇宇宙」也一直再进化,从变装到心理战!就算演的是有点傻气的副角色,他眼神仍然在计算局势;猛烈动作戏之后,他也仍然挂心著必须守护的人。金道奇能…

《<strong>模范的士3</strong>》收视飙破新高!由李帝勋打造的「道奇宇宙」全面升级:剧情揭露金义圣背后动人故事(模范出租车剧情介绍电视猫)

打单就这样开单!真的很方便~(开单怎么开)

开单直接选择商品,自动带出上次的单价(价格记忆功能),填上数量,一键收款就可以打印出单了,十几秒就可以搞定一张单据。库存实时增减更新,怕缺货开『库存预警』自动提醒补货 销售、采购清单打印出来清晰明了,随时谁地…

打单就这样开单!真的很方便~(开单怎么开)