Apple Intelligence 视觉智能(Visual Intelligence)是一种「图像识别」 AI 智慧功能,能够「看懂」相机拍到的画面以及屏幕上显示的内容,帮助你快速了解眼前事物; 下面就认识并解 Apple Intelligence 视觉智能的使用方式与技巧,推荐你在启用 Apple Intelligence 后也可以自己玩玩看。
Apple Intelligence 启用方式
目录
开始使用前,先快速带一下 Apple Intelligence 启用方式; 只要将符合 Apple Intelligence 要求的机型(iPhone 15 Pro 以上)更新至 iOS 26.1 正式版以上、语言维持在繁体中文,系统就会自动下载 Apple Intelligence 所需的运作模型。
请注意,Apple Intelligence 模型的文件体积不小,以我 iPhone 15 Pro 来说就有 13.27GB,请确保手机有足够的剩余空间; 耐心等待下载完成,看到 Apple Intelligence 呈现开启状态即可开始使用。

Apple Intelligence 视觉智能触发方式
接着是 Apple Intelligence 视觉智能功能的触发方式,这边分为两种:
有相机控制钮的 iPhone:长按相机控制钮即可
配备相机控制钮的机型(iPhone 16、iPhone 16 Plus、iPhone 16 Pro、iPhone 16 Pro Max、iPhone 17、iPhone Air、iPhone 17 Pro、iPhone 17 Pro Max),只要长按相机控制钮即可叫出Apple Intelligence视觉智能功能,作界面会从相机控制钮的地方扩散出来。

没有相机控制钮的 iPhone:可设置在「动作按钮」或其他快捷功能上
如果是没有相机控制钮的机型(iPhone 15 Pro、iPhone 15 Pro Max、iPhone 16e)有两种选择,可以把 Apple Intelligence 视觉智能设置在「动作按钮」或「快捷功能(控制中心、锁定画面下方的功能键)」。
到「设置」>「动作按钮」找到「视觉智能」就能绑定在动作按钮上。

长按编辑控制中心,将「视觉智能」加入到控制中心,就不必占用到动作按钮。

或是长按编辑锁定画面,将「视觉智慧」加到屏幕下方的快捷功能也 ok。

Apple Intelligence 视觉智能使用技巧
1. 拍照询问 ChatGPT、进行 谷歌 搜图
第一个最简单也最直接的Apple Intelligence视觉智能使用技巧,就是对着物体拍照,并询问ChatGPT或进行谷歌搜图。
进到视觉智能界面,对着想暸解的物体按下快门键(照片不会保存在相册中,只用于视觉智能功能而已),再依照需求选择左侧按钮「询问 ChatGPT」或右侧按钮「谷歌 搜图」即可。想要更快一点,可以不按快门键,直接点击「询问 ChatGPT」或「谷歌 搜图」。

这边做个简单示范,例如我拍一台模型车,然后问 ChatGPT 相关问题就能快速得到答案,ChatGPT 也支持连续问答。

或是用 谷歌 搜图快速找到类似的物品。

若画面中有多个物体,可以把想搜索的物体「圈起来」或「画起来」,ChatGPT 与 谷歌 搜图就会针对目标物体来给答案。

顺带一提,Apple Intelligence 视觉智能也内置「图像查询」功能,能够辨识出植物、食物、景点、动物、艺术品的相关信息。
例如给 Apple Intelligence 视觉智能看一幅毕加索的画作,它就会告诉你画名、背景故事等等。

但要注意,只要离开 Apple Intelligence 视觉智能整个搜索就会结束,系统也不会保留搜索纪录,想重新搜索就得从头作一次,推测可能是针对隐私保护的设计。
另外,Apple Intelligence 视觉智能在辨识内容时可能存在误差,建议暂时以辅助参考为主,若有疑虑请进一步查证资讯正确性。
2. 结合「原况文字」,作更方便
Apple Intelligence 视觉智能也有整合原况文字功能,可以直接抓出画面中的关键信息,方便后续应用。
例如我拍豆浆的盒子,会看到视觉智能直接辨识出地址、电话、网站、邮件。

拍一篇苹果第四季财务报告,则是能够生成摘要、朗读文字。

甚至还有抓到苹果说「股利将于 2025 年 11 月 13 日派发」,所以能够建立一个「11/13 股利派发」的行事历。

拍外文的话,当然也能直接进行翻译,对于出国旅游来说很实用。

整理来说,Apple Intelligence 视觉智能整合原况文字的功能非常丰富,鼓励大家多探索看看,搞不好会发现意外惊喜。
3. 屏幕截图画面辨识
在iOS 26中,Apple Intelligence视觉智能也导入「屏幕辨识」功能,不仅能看懂外界事物、也能辨识屏幕上的元素。
当你在屏幕上看到任何想搜索的东西,只要截图并点开截图进到编辑画面,就会在下方看到「ChatGPT 询问钮」以及「谷歌 搜图钮」,就依照需求来跟 ChatGPT 对话或 谷歌 搜索图片。

如果觉得点开截图很麻烦,可以到「设置」>「一般」>「屏幕截图」开启「全屏幕预览」; 这样在截图当下就会直接进到编辑画面,体验更直觉。

若想搜索截图中的特定元素,一样也是用手指把想搜索的东西圈起来或画起来,再进行询问即可。

当然屏幕识别同样有支持「原况文字」与「图像识别」,截图若有包含可识别的文字、物体、关键信息,就会显示相关功能在底部的中间区域; 例如辨识到动物会解释动植物会显示品种信息、辨识到艺术品会找到作品名称、作家相关信息等等。

画面中若有文字、电话、地址、数量单位、网址、甚至是 QR Code 这些也都没问题。

包含前面有讲到的「加入行事历」也都可用,例如我截图新北欢乐耶诞城的宣传图,视觉智能就自动辨识活动名城、时间日期,点击「制作进程」即可加入行事历、或点「编辑」来输入更详细的活动信息。

Apple Intelligence 视觉智慧:总结
以上 Apple Intelligence 视觉智慧的教程与使用技巧分享; 最大卖点就是让「搜索」变得更直觉简单,拍张照或截个图就能马上找资料,而且繁体中文的体验也不错,是 Apple Intelligence 中我很推荐大家使用的智慧功能。
如果你刚启用 Apple Intelligence,不妨多试试把视觉智能应用在不同的情境,像是辨识商品、翻译标示或建立日历事件,可能会发现越用越顺手,也越能理解它如何融入你的生活。
不过目前视觉智能在辨识内容上仍可能出现误差,建议暂时以辅助参考为主,若有疑虑请进一步查证信息正确性; 期待后续随着 Apple Intelligence 持续更新,视觉智能能在准确度与反应速度上再更进一步,成为 iPhone 上最实用的 AI 功能之一。
微信扫一扫
