A pesar de que algunos teléfonos ya cuentan con algo parecido a un asistente personal digital, como es el caso de Siri en iPhone o la aplicación Google Now, a la hora de la verdad éstos apenas saben responder preguntas básicas como cuál es el restaurante chino más cercano.
Las grandes compañías tecnológicas quieren cambiar esto, y para dar el primer paso, dicen, lo primero es lograr que estos asistentes sean capaces de mantener con nosotros conversaciones fluidas que se desarrollen de forma natural.
Para ello lo que se necesita es crear una verdadera Inteligencia Artificial (IA), capaz de interactuar con humanos utilizando su mismo lenguaje.
Lenta evolución
¿Qué alternativas existen entonces para elevar el coeficiente intelectual de estos asistentes?
Microsoft, por ejemplo, todavía no cuenta con un asistente virtual en su plataforma Windows Phone, pero la compañía está experimentando con una IA que ya opera en ascensores y computadoras de escritorio de su sede.
«Hay unas señales de contexto básicas; estas incluyen ubicación, hora del día, día de la semana, patrones de comportamiento de uso y el modo (estás conduciendo, caminando, sentado o en tu oficina)».
«El calendario de una persona puede ser una fuente rica en contexto, así como el correo electrónico».
Como un tango complejo
Según dice, para que una interacción sea natural el programa también necesita aprender a simular el ritmo y cadencia de los humanos al hablarse los unos a los otros.
Para hacer esto, las computadoras deberían estar pensando en su respuesta mientras la persona todavía está hablando, en lugar de esperar a que terminen. «Resulta que la conversación es más o menos como un tango muy, muy complejo, una danza entre dos personas».
«No involucra sólo hablar en turnos, como ves en los asistentes de celular de hoy en día. En realidad es una operación muy complicada, fluida, donde la gente habla, reflexiona y escucha una y otra vez, algunas veces haciendo todo a la vez».
Se cree que la IA diseñada por Microsoft podría estar basada enCortana, uno de los personajes de su serie de videojuegos Halo y que ésta podría eser presentada en abril.
Paralingüística
Nuance, empresa especializada en dispositivos de reconocimiento de voz, dice que sus investigadores estudian actualmente lo que se conoce como «paralingüística», que analiza la forma en que los usuarios hablan en lugar de lo que dicen.
«Estamos analizando los elementos acústicos para ser capaces de detectar emociones en el habla», revela John West de Nuance.
«La entonación, lo que se conoce como prosodia (el tono utilizado cuando se habla) se desenvuelve bien cuando estás feliz. Si estás triste es más abrupta».
Según West, ya son capaces de introducir tonos de duda y otras señales no verbales. «Sin embargo, precisan ser cuidadosamente programadas porque tienen que entender dónde hacer las pausas, respiraciones y posiblemente una tos».