Apple patenta nueva tecnología que permite leer los labios durante los comandos de voz

En una nueva apuesta por la innovación y mejora continua de sus productos, Apple ha patentado una revolucionaria tecnología que permite leer los labios de los usuarios durante los comandos de voz, incluso en entornos con interferencias.

Esta tecnología se aplicaría a dispositivos que soportan el asistente digital de la compañía, Siri. Apple ha reconocido que su asistente inteligente, Siri, enfrenta dificultades para entender las peticiones de los usuarios en diferentes escenarios, especialmente cuando hay ruido o interferencias presentes. Estas situaciones dificultan la captación precisa de los comandos de voz, generando frustración y limitando la experiencia del usuario.

La solución de Apple 

Para superar estos desafíos, Apple ha desarrollado un sistema de reconocimiento de voz basado en la lectura de labios. El sistema utiliza sensores de movimiento, como acelerómetros y giroscopios, para detectar los movimientos y vibraciones de la boca, la cara, la cabeza y el cuello durante el habla. Estos datos de movimiento se comparan con patrones previamente aprendidos, permitiendo al sistema entender la petición del usuario.

Funcionamiento y aplicaciones 

El sistema de reconocimiento de voz de Apple analiza los movimientos y vibraciones durante el habla del usuario y los compara con una base de datos de movimientos anteriores para encontrar coincidencias. De esta manera, el sistema puede identificar los comandos de voz y llevar a cabo acciones específicas. Por ejemplo, usuarios podrán solicitar acciones como escribir y enviar mensajes, fijar recordatorios o realizar llamadas sin importar el ruido ambiental o las interferencias presentes.

Esta nueva tecnología de lectura de labios podría ser especialmente útil en entornos ruidosos, como eventos deportivos, conciertos o lugares de trabajo con alto nivel de ruido, donde los micrófonos pueden tener dificultades para captar con precisión los comandos de voz. Además, al utilizar sensores de movimiento en lugar de micrófonos, se reduce significativamente el consumo de energía, optimizando la duración de la batería de los dispositivos.

Desarrollo de la tecnología 

Para desarrollar esta tecnología, Apple debería analizar un amplio conjunto de datos sobre los movimientos específicos que los usuarios realizan para pronunciar cada palabra. Este análisis permitiría a la compañía crear perfiles de voz personalizados y diferenciar tanto la pronunciación de cada usuario como el idioma en el que se realizan las peticiones.

Perspectivas futuras 

Aunque la patente de Apple revela su interés por esta innovadora tecnología, aún no se ha confirmado si se implementará en futuros productos comerciales. Sin embargo, la posibilidad de mejorar la capacidad de comprensión de los asistentes de voz en situaciones con interferencias y ruido ambiental abre un espectro de posibilidades para Apple y los usuarios de sus dispositivos.

Redacción: RLC Noticias

Notas relacionadas

RLC Noticias de Rosario la ciudad

Comentarios