未来Apple Vision Pro或通过唇语识别实现无声指令输入

文章配图

苹果正在研究如何让未来的Apple Vision Pro通过识别嘴唇动作来实现纯唇语指令或听写功能。

这是对现有AirPods Pro功能的延伸——用户可通过摇头拒接来电或点头接听。该设计适用于无法发声的场合,或双手忙碌时仍能操作设备。

在一项名为”带听写结构的电子设备”的新专利中,苹果希望用户即使无法正常发声也能完成听写。

“当用户处于需要谨慎、隐私或安静的公共场所时,语音听写会显得尤为不便”,苹果在这份关于未来Vision Pro功能的专利申请中写道。

专利未提及佩戴头显无声自语可能带来的社交影响,但在嘈杂环境中,该技术确实具有实用价值。

“某些环境中的背景噪音会干扰头戴设备准确识别用户语音输入的能力”,专利补充道,”因此需要一种能让用户轻松完成无声输入的头戴设备”。

方案包含多种传感器组合:显示框架外部朝下的视觉传感器可检测嘴唇动作;附加传感器能捕捉面部振动或形变;内置摄像头则通过眼球追踪确认选择。

为增强可靠性,系统还支持通过外置摄像头识别确认输入的手势指令。

最终方案允许用户通过手势开启/关闭听写模式,期间所有唇部动作都将被转换为文字输入。

专利未明确说明设备是否会同时接收常规语音指令。若无明确信号,头显可能持续记录所有唇部动作,包括无意识的喃喃自语。

苹果提到可利用音频训练设备识别用户语音模式,包括40-70分贝的正常语音和20-50分贝的耳语音频样本。

视觉训练数据则包含用户嘴部的多角度视图,如面向用户的设备拍摄的全景嘴部图像,或下颌摄像头捕捉的局部嘴部俯视角画面。

该专利申请由高产发明人Paul X. Wang单独提交,他此前还曾为Apple Vision Pro设计过游戏控制器等多项专利。

Related Posts

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注