豆包手机助手回应:不存在截屏银行安全键盘等敏感界面内容
近日,有关豆包手机助手能否截取银行安全键盘等受保护界面内容的讨论在科技社区持续发酵。有用户指出,豆包手机助手可能通过READ_FRAME_BUFFER权限,从GPU图形缓冲区获取图像数据,绕过常规的截图API。此外,用户还质疑其使用CAPTURE_SECURE_VIDEO_OUTPUT权限,可能用于捕获受保护内容。
针对上述质疑,豆包手机助手官方作出回应,强调这是对产品技术实现方式的误解。官方表示,豆包手机助手采用的是原生系统截屏接口,严格遵循Android系统的Secure标记机制,因此无法截取银行安全键盘等声明为Secure的受保护界面。
为便于验证,官方表示,用户可通过编写一个包含Secure标记页面的APK,自行测试AI是否能识别相关内容。测试结果将显示,AI无法读取受保护的界面信息。
关于READ_FRAME_BUFFER权限的使用,官方解释称,该权限主要为AI提供后台操作能力,使三方应用能够在虚拟屏空间中运行。具体而言,为实现对虚拟屏中运行应用的截屏功能(对应WindowManagerService.captureDisplay方法),并将其图像内容上传至豆包大模型进行推理,豆包手机助手申请了该权限。
然而,即便具备此权限,系统也无法读取银行APP等第三方应用中设置为Secure的内容,从而确保用户敏感信息的安全。
至于CAPTURE_SECURE_VIDEO_OUTPUT权限的使用,官方解释,该权限的引入是因为在虚拟屏中,受保护内容的投影(例如通过灵动岛打开的应用)可能显示为黑屏,导致用户无法查看和操作相关内容。为此,该权限用于确保受保护内容能在用户界面中正常显示。
不过,即使投影内容可见,相关页面仍会被系统标记为Secure,仅允许用户查看,而无法截屏。
豆包手机助手的操作机制
豆包手机助手的工作流程主要分为四个步骤:用户发出指令→系统截屏并上传至云端大模型→模型分析界面并返回操作指令→手机端执行操作。这一过程在任务完成前将持续循环。
由于视觉分析任务所需的模型参数规模较大,当前受限于移动端芯片性能,相关模型无法本地运行,因此必须将截屏图像上传至云端进行处理。官方指出,目前国内市场中多家手机厂商推出的具备AI操作能力的助手产品,大多也采用类似机制,并需申请READ_FRAME_BUFFER等系统权限。
值得注意的是,豆包手机助手仅在用户明确发出操作指令时才会启动截屏功能,且不会截取带有Secure标记的第三方应用界面。此外,上传至云端用于分析的截图内容不会被长期存储,仅用于视觉理解与任务执行。