¿Hablas con tu voz? dispositivos y prefiere la búsqueda por voz en lugar de escribir para encontrar información en línea? Las tecnologías de control de voz lideradas por pesos pesados de la industria como Amazon Alexa, Siri de Apple y Google Assistant han disfrutado de una rápida subir en años recientes. A la gente le gustan porque permiten interacciones auténticas y naturales y son instintivos.
La tecnología de voz también es la puerta de entrada a experiencias intuitivas de metaverso.
Piense en cómo funcionan la mayoría de los auriculares VR de hoy. Los usuarios necesitan controladores de realidad virtual para interactuar con el entorno, moverse y navegar. Puede agarrar y empujar objetos virtuales con la ayuda de estos controladores, que son dispositivos similares a un joystick. Sin embargo, debido a que son portátiles, restringen los posibles casos de uso, como trabajar en un metaverso de lugar de trabajo donde usar las manos es una necesidad absoluta. Por otro lado, los comandos de voz permiten a los usuarios controlar y navegar mundos virtuales con las manos libres.
Los comandos basados en la voz también pueden aumentar la comodidad de las experiencias de realidad aumentada, independientemente de si funcionan a través de teléfonos inteligentes o gafas inteligentes. En la mayoría de los casos, usar nuestra voz es más cómodo que escribir textos largos.
La tecnología de reconocimiento de voz y voz dará forma al futuro metaverso
Dos tecnologías relacionadas serán decisivas en el futuro de un metaverso comandado por voz: el reconocimiento de voz y el reconocimiento de voz.
El reconocimiento de voz utiliza tecnologías de procesamiento de lenguaje natural y aprendizaje automático para reconocer el lenguaje humano. Esencialmente ayuda a entender las palabras exactas que usa el hablante. Los casos de uso comunes son traducciones automáticas en tiempo real, subtítulos y comandos de voz directos. Se puede aplicar, por ejemploen juegos de metaverso para que los jugadores puedan dar comandos de voz mientras controlan simultáneamente el juego con sus manos.
El propósito del reconocimiento de voz es reconocer la identidad del hablante. Esta tecnología no se centra en las palabras que se pronuncian, sino en características como los acentos, los dialectos y la velocidad que caracterizan cómo habla una persona.
Por ejemplo, puede ayudar a que sus dispositivos lo reconozcan. Por lo tanto, la tecnología se utiliza principalmente para crear contraseñas de voz para dispositivos personales. También puede ayudar a entrenar asistentes personales de IA como Siri y Alexa para que solo ayuden a una persona específica. Una conferencia virtual en la que participan muchos oradores es un escenario de metaverso en el que el reconocimiento de voz puede ser útil. En tales circunstancias, se puede utilizar para diferenciar quién dijo qué.
Lo más probable es que el futuro metaverso dependa en gran medida de ambas tecnologías. Considere, por ejemplo, la solución de software de control de voz DesgasteHF desarrollado por Realwear. Los usuarios pueden integrar el software con los auriculares de nivel industrial de la empresa para convertirlo en un dispositivo de manos libres con la opción de activar o desactivar la función de reconocimiento de la voz del orador.
Habilitar los comandos de voz abre aplicaciones para experiencias fluidas.
Tomemos, por ejemplo, la compra de metaversos, donde conversión las tasas pueden alcanzar hasta el 70% de los visitantes, y se espera que el tamaño del mercado alcance los 800 mil millones para 2024.
Si los creadores de AR y VR pueden proporcionar interacciones de voz además de interacciones de apuntar y hacer clic, las compras de metaverso pueden ser más seguras gracias a la verificación de seguridad a través de la voz. Además, los consumidores pueden pasear por las tiendas virtuales con las manos libres para disfrutar de una experiencia de compra más inmersiva.
Haga coincidir las pistas de voz en off con los avatares del metaverso en 3D para crear expresiones faciales mejoradas.
La tecnología de voz también es crucial para otros casos de uso del metaverso. Por ejemplo, podemos aprovecharlo para equipar avatares con expresiones faciales más realistas. NVIDIA, la empresa líder en IA y metaverso, está desarrollando la aplicación. Omniverso Audio2Face. La aplicación aprovecha las tecnologías generativas de inteligencia artificial para sincronizar el audio de voz en off con la animación de un personaje en 3D. La aplicación se puede utilizar para crear avatares de metaverso realistas o asistentes digitales en tiempo real.