Camera capture (agent)
OpenClaw 支持摄像头捕获用于智能体工作流:
- iOS 节点(通过网关配对):通过
node.invoke捕获照片(jpg)或短视频片段(mp4,可选音频)。 - Android 节点(通过网关配对):通过
node.invoke捕获照片(jpg)或短视频片段(mp4,可选音频)。 - macOS 应用(通过网关节点):通过
node.invoke捕获照片(jpg)或短视频片段(mp4,可选音频)。
所有摄像头访问都受用户控制设置限制。
iOS 节点
用户设置(默认开启)
- iOS 设置标签页 → Camera → Allow Camera (
camera.enabled)- 默认:开启(缺失键被视为启用)。
- 关闭时:
camera.*命令返回CAMERA_DISABLED。
命令(通过网关 node.invoke)
camera.list- 响应负载:
devices:{ id, name, position, deviceType }数组
- 响应负载:
camera.snap- 参数:
facing:front|back(默认:front)maxWidth: 数字(可选;默认1600,在 iOS 节点上)quality:0..1(可选;默认0.9)format: 当前为jpgdelayMs: 数字(可选;默认0)deviceId: 字符串(可选;来自camera.list)
- 响应负载:
format: "jpg"base64: "<...>"width,height
- 负载保护:照片会被重新压缩,将 base64 负载保持在 5 MB 以下。
- 参数:
camera.clip- 参数:
facing:front|back(默认:front)durationMs: 数字(默认3000,最大限制为60000)includeAudio: 布尔值(默认true)format: 当前为mp4deviceId: 字符串(可选;来自camera.list)
- 响应负载:
format: "mp4"base64: "<...>"durationMshasAudio
- 参数:
前台要求
像 canvas.* 一样,iOS 节点只允许在前台执行 camera.* 命令。后台调用返回 NODE_BACKGROUND_UNAVAILABLE。
CLI 助手(临时文件 + MEDIA)
获取附件的最简单方法是通过 CLI 助手,它将解码的媒体写入临时文件并打印 MEDIA:<path>。
示例:
bash
openclaw nodes camera snap --node <id> # 默认:前+后(2 条 MEDIA 行)
openclaw nodes camera snap --node <id> --facing front
openclaw nodes camera clip --node <id> --duration 3000
openclaw nodes camera clip --node <id> --no-audio注意事项:
nodes camera snap默认为两者朝向,以便为智能体提供两种视图。- 输出文件是临时的(在操作系统临时目录中),除非你构建自己的包装器。
Android 节点
用户设置(默认开启)
- Android 设置表单 → Camera → Allow Camera (
camera.enabled)- 默认:开启(缺失键被视为启用)。
- 关闭时:
camera.*命令返回CAMERA_DISABLED。
权限
- Android 需要运行时权限:
CAMERA用于camera.snap和camera.clip两者。RECORD_AUDIO用于camera.clip当includeAudio=true时。
如果权限缺失,应用会在可能的情况下提示;如果被拒绝,camera.* 请求会失败,并返回 *_PERMISSION_REQUIRED 错误。
前台要求
像 canvas.* 一样,Android 节点只允许在前台执行 camera.* 命令。后台调用返回 NODE_BACKGROUND_UNAVAILABLE。
负载保护
照片会被重新压缩,将 base64 负载保持在 5 MB 以下。
macOS 应用
用户设置(默认关闭)
macOS 伴侣应用公开一个复选框:
- Settings → General → Allow Camera (
openclaw.cameraEnabled)- 默认:关闭
- 关闭时:摄像头请求返回"Camera disabled by user"。
CLI 助手(node invoke)
使用主 openclaw CLI 在 macOS 节点上调用摄像头命令。
示例:
bash
openclaw nodes camera list --node <id> # 列出摄像头 id
openclaw nodes camera snap --node <id> # 打印 MEDIA:<path>
openclaw nodes camera snap --node <id> --max-width 1280
openclaw nodes camera snap --node <id> --delay-ms 2000
openclaw nodes camera snap --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --duration 10s # 打印 MEDIA:<path>
openclaw nodes camera clip --node <id> --duration-ms 3000 # 打印 MEDIA:<path>(旧标志)
openclaw nodes camera clip --node <id> --device-id <id>
openclaw nodes camera clip --node <id> --no-audio注意事项:
openclaw nodes camera snap默认为maxWidth=1600,除非被覆盖。- 在 macOS 上,
camera.snap在预热/曝光稳定后等待delayMs(默认 2000ms),然后才捕获。 - 照片负载被重新压缩,将 base64 保持在 5 MB 以下。
安全性 + 实际限制
- 摄像头和麦克风访问触发正常的操作系统权限提示(并且需要在 Info.plist 中有使用字符串)。
- 视频片段被限制(当前
<= 60s)以避免过大的节点负载(base64 开销 + 消息限制)。
macOS 屏幕视频(操作系统级别)
对于屏幕视频(不是摄像头),使用 macOS 伴侣:
bash
openclaw nodes screen record --node <id> --duration 10s --fps 15 # 打印 MEDIA:<path>注意事项:
- 需要 macOS Screen Recording 权限(TCC)。