在2026年Google I/O大会上,谷歌预告了Gemini macOS应用即将于今夏推出的两项重要新功能。
谷歌于今年4月推出了原生Mac应用,据悉开发过程中有一支"小团队"借助Antigravity工具参与其中。
Gemini Spark是一款全天候在线的个人AI智能体,能够代替用户执行操作,帮助用户"管理好自己的数字生活"。其功能涵盖与Gmail、Docs及其他Workspace应用的深度集成,同时也支持第三方服务。该功能将于下周向Google AI Ultra订阅用户(每月100美元)开放测试版,适用平台包括Android、iOS版Gemini应用及网页端。
Spark今夏将正式登陆macOS版Gemini,届时用户可以利用它执行"涉及本地文件的任务,并实现跨桌面应用的工作流自动化"。此外,它还将与现有功能无缝衔接——用户可以将任意已打开的窗口内容作为提示词的上下文输入。
全新语音交互体验允许用户随意开口说话,无需担心思考过程中脱口而出的"嗯"或"那什么"等口头语。在Mac上长按功能键后,屏幕底部将出现一个浮动的胶囊形图标;松开按键即可提交提示词,并显示思考动画以呈现处理进度。
Gemini能够结合屏幕上的内容,将用户自由表达的语音转化为精准的文字草稿,并在光标所在位置即时完成格式整理,准确捕捉用户的表达意图。
在本周二的主题演讲中,谷歌现场演示了这样一个场景:先在Finder中选中文件,随后通过语音口述邮件内容,Gemini便自动将内容填入Gmail的邮件撰写窗口。
Q&A
Q1:Gemini Spark智能体具体能帮用户做哪些事情?
A:Gemini Spark是一款全天候在线的个人AI智能体,可以代替用户执行多种操作。它支持与Gmail、Docs等Google Workspace应用深度集成,也能连接第三方服务。在macOS端,Spark还能处理本地文件相关任务,并实现跨桌面应用的工作流自动化,同时支持将已打开的窗口内容作为提示词的上下文,帮助用户更高效地管理数字生活。
Q2:macOS版Gemini的新语音功能怎么使用?
A:在Mac上长按功能键,屏幕底部会出现一个浮动的胶囊形图标,用户可以直接开口说话,无需刻意组织语言,口头语和停顿都不影响使用。松开功能键后,Gemini会自动提交语音内容,并结合当前屏幕上下文,将自由表达的语音转化为精准的文字草稿,直接插入光标所在位置,格式整理也同步完成。
Q3:Gemini Spark什么时候可以用?需要订阅哪个套餐?
A:Gemini Spark将于近期向Google AI Ultra订阅用户开放测试版,该套餐每月收费100美元,支持Android、iOS版Gemini应用及网页端。macOS版本的Spark功能预计在今夏推出,包括本地文件处理和桌面工作流自动化等功能。