💡今日趋势速览:阿里Qwen系列密集迭代,Qwen3.7-Plus强化多模态Agent原生视觉推理能力,可直接从视觉输入驱动代码生成与任务执行,标志着视觉语言模型向真实世界Agent工作流的深度融合;同期开源的Qwen-AgentWorld-35B采用MoE架构兼顾性能与效率,为构建可持续运行的具身智能系统提供开源基底。
📋 今日内容汇总
🤖 AI动态
- 阿里发布 Qwen3.7-Plus 多模态 Agent 模型
- 阿里开源 Qwen-AgentWorld 世界模型
- 快手开源 MobileForge 移动 GUI 代理
- 字节推出 SeedMusic 1.0 音乐模型
- Cursor 推出 Customize 统一配置页
- TRAE Work 发布 Design 设计模式
- NVIDIA 发布 Metropolis VSS 3 蓝图
- Codex CLI 日志过量写入损耗 SSD
- Atomic Chat 让 Cline 本地运行编码 Agent
- OpenRouter 推出统一图像生成 API
🔌 AI基础设施
11.Meta 与微软追加数百亿数据中心租约
12.OpenAI 发布首款自研 AI 芯片 Jalapeño
🧪 芯片半导体
13.璇相科技研制百万级原子光镊超表面芯片
🦾 机器人具身智能
14.宁德时代联手银河通用推出重载人形机器人
15.HIW-500 开源人形机器人遥操作数据集
📌 模型排行榜
16.Artificial Analysis AI 模型能力排行榜
🤖 AI动态
1.阿里发布 Qwen3.7-Plus 多模态 Agent 模型
阿里云发布 Qwen3.7-Plus,面向多模态 agent 执行,覆盖 GUI 交互、工具调用与编码。模型可从视觉输入直接驱动代码生成与真实任务执行,专为长期运行的真实世界 agent 工作流设计,已在阿里云上线并提供限时优惠。以上是官方给出的 demo
2.阿里开源 Qwen-AgentWorld 世界模型
阿里 Qwen 团队开源 Qwen-AgentWorld-35B-A3B 模型,采用 MoE 架构,总参数 35B、活跃参数 3B,支持 256K 上下文,同步发布 AgentWorldBench 基准。模型沿构建可控模拟器与内化世界建模两条路线,让 agent 学会先预测环境再行动,探索语言世界建模对通用 agent 能力的拓展。
3.快手开源 MobileForge 移动 GUI 代理
快手在 HuggingFace 开源 MobileForge,一套无需人工标注即可从真实应用交互中适配移动 GUI agent 的系统。其适配后的 agent 在 AndroidWorld 基准上达到 77.6% 的 Pass@3,全程不依赖人工编写的任务或标签,显著降低了移动端 agent 的数据准备成本。
4.字节推出 SeedMusic 1.0 音乐模型
字节跳动推出 AI 音乐模型 SeedMusic 1.0 Preview,用户用一句话提示即可在两三分钟内生成一首完整歌曲。模型可按提示混合古风与流行节奏等多种风格,生成含词曲与编曲的完整作品,目前处于预览体验阶段。以下是其生成的音乐demo
5.Cursor 推出 Customize 统一配置页
Cursor 推出全新 Customize 页面,在用户、团队和工作区层级统一管理插件、技能、MCP、子智能体、规则与钩子。新增市场排行榜与一键安装,插件支持 Hex、Atlassian 等预构建画布,团队市场可导入 GitLab、Bitbucket、Azure DevOps 仓库分发插件。
6.TRAE Work 发布 Design 设计模式
TRAE Work 发布 Design 模式,桌面端、网页端及中国版与国际版同步全量上线。用户用自然语言生成设计稿并套用品牌模板,可在画布精修或一键导出可交互原型;支持导入 Figma 自动生成设计系统,并能一键转入 Code 模式由 AI 构建前端项目。
7.NVIDIA 发布 Metropolis VSS 3 蓝图
NVIDIA 推出 Metropolis 视频搜索与摘要 VSS 3 蓝图,新增 16 项可由自然语言驱动的 agent 技能,覆盖搜索、摘要、警报、报告与片段审查。蓝图提供统一开源代码库与 Docker、Helm 部署配置,并集成 Nemotron 3 Nano Omni 与排名第一的 3D 多摄像头追踪。以下是官方给出的 demo
8.Codex CLI 日志过量写入损耗 SSD
OpenAI 紧急修复 Codex CLI 缺陷:其 SQLite 反馈日志持续大量写入,开发者实测每年约写入 640TB,相当于 1TB 固态硬盘每年 640 次全盘写入,不到一年即可耗尽主流 SSD 的 600TBW 质保寿命,OpenAI 已确认正在修复。
9.Atomic Chat 让 Cline 本地运行编码 Agent
开源本地 AI 应用 Atomic Chat 可作为编码 agent Cline 的本地模型层,离线运行 1000 余个开源权重模型并暴露本地 API。Cline 负责读取文件、编辑代码、运行终端命令等 agent 操作,二者结合让编码 agent 无需云端即可在私人设备上运行。以下是官方给出的 demo
10.OpenRouter 推出统一图像生成 API
OpenRouter 推出专用图像生成 API,统一接入 Google、OpenAI、Black Forest Labs、Recraft、字节、Microsoft、xAI 等 8 家提供商的 30 余个图像模型,并提供类型化动态能力以解决不同图像 API 的异构问题,开发者可用单一接口调用多家模型。
🔌 AI基础设施
11.Meta 与微软追加数百亿数据中心租约
Meta 和 Microsoft 在最近一个季度各自承诺追加数百亿美元的额外数据中心租约,用于扩展人工智能训练与推理所需的算力基础设施,进一步推高科技行业的资本投入规模,反映头部厂商对 AI 算力需求的持续加码。
12.OpenAI 发布首款自研 AI 芯片 Jalapeño
OpenAI 发布首款自研 AI 芯片 Jalapeño,从零开始为大型语言模型推理设计,定位为智能处理器。OpenAI 负责架构与算法设计,联手博通与天弘科技协同推进工业化量产,将用于 ChatGPT、Codex 和 API 推理,深入布局全栈基础设施。
🧪 芯片半导体
13.璇相科技研制百万级原子光镊超表面芯片
上海璇相科技宣布研制出全球首款可产生百万级原子光镊阵列的超表面芯片,并与量子计算企业中器无量合作,在中性原子实验平台上完成系统级验证,为中性原子量子计算的规模化发展奠定基础。
🦾 机器人具身智能
14.宁德时代联手银河通用推出重载人形机器人
宁德时代与银河通用机器人签署全球战略合作,焦点为银河通用研发的重载人形机器人 Galbot S1,它是全球首款搭载宁德时代电池的具身智能常态化运营机器人,凭借电池续航优势已正式上岗作业。
15.HIW-500 开源人形机器人遥操作数据集
BitRobot 联合宇树科技与 HuggingFace 推出 HIW-500,迄今最大的开源人形机器人遥操作数据集,在东南亚 12 个真实家庭环境中采集,累计超过 500 小时野外操作记录,用于人形机器人在真实家庭场景的训练。以下是官方给出的 demo
📌 模型排行榜
16.Artificial Analysis AI 模型能力排行榜
最后是今日的 AI 模型能力排行榜单,三大榜单显示,Claude Fable 5虽未上线但领跑,Claude Opus 4.8与GPT-5.5形成头部双雄,Gemini 3.5 Flash在代码榜表现亮眼。闭源阵营垄断前三。
以上是今天的AI 风向标,欢迎在评论区提出建议,我们明天见。