Las voice user interfaces (VUI) son cada día más habituales en nuestro entorno. Las usamos con el navegador del coche, con los asistentes del móvil e incluso con dispositivos como Echo o Google Home. La evolución de las inteligencias artificiales, el machine learning y los avances en el procesamiento del lenguaje natural han hecho posible la integración en tiempo real de esta tecnología.
Ahora, el reto de los diseñadores reside en cómo integrar los comandos de voz en la experiencia de usuario web. Esta tecnología se encuentra todavía en un estadio inicial en las conversaciones en tiempo real, incluso en interfaces multimodales como una página web.
Retos de las voice user interfaces en el diseño de experiencia del usuario
Una de las grandes dificultades en el diseño de experiencias de usuario en plataformas multimodales es mantener la coherencia entre los elementos visuales y los comandos verbales. Es decir: cómo ajustar la interacción entre lo que el usuario ve y lo que le pide a la plataforma mediante su voz.
Mantener un flujo de navegación coherente integrando comandos por voz requiere un gran trabajo de anticipación. Al diseñar la plataforma, debemos tener en cuenta qué preguntas podrían hacer los usuarios y en qué momentos las plantearían. Solo así será posible que la navegación sea fluida y la experiencia de usuario, positiva.
En esta coherencia entra en juego un factor importantísimo: el lenguaje. Parece obvio, pero diferentes personas hacen la misma pregunta de distintas formas. Por tanto ¿cómo ajustar una interfaz de usuario de voz para que asimile una respuesta única a todas esas posibles preguntas? Una de las opciones que más se ha planteado es la de establecer una serie de comandos unificados. Pero, pretender que el usuario las memorice, va contra la naturaleza misma de las voice user interfaces. Estas tratan precisamente usar un lenguaje natural para comunicarnos con los dispositivos.
La personalización de la experiencia de usuario a través de la voz es uno de los puntos calientes del diseño actual. El machine learning permite que las plataformas puedan aprender a partir de los hábitos de un mismo usuario. Pero el engagement parece ser un factor que juega en contra de la consolidación de las tecnologías de voz.
El motivo es simple. La complejidad de las interacciones por voz con el usuario dificulta la navegabilidad. Esto empeora su percepción sobre este tipo de tecnologías. Por tanto, si no avanzan rápidamente para mejorar la experiencia de usuario, es posible que en el futuro se vean obligadas a ocupar un segundo plano a la hora de diseñar webs y apps.
El futuro de las voice user interfaces parece algo incierto. Queda por ver hasta qué punto los desarrolladores pueden mejorar la exactitud de las interpretaciones de estas tecnologías. Y, por supuesto, cómo los diseñadores de experiencia de usuario pueden crear mejores interacciones y reducir la fricción entre las personas y la interfaz de voz.