spinner

Regreso al futuro. La evolución de los Chatbots y Smart Assistants en los últimos 3 años

Hemos hecho un recorrido por la historia de los chatbots, contando nuestra experiencia desde las primeras pruebas de concepto hasta el desarrollo de Smart Assistants en las distintas plataformas que existen a día de hoy.

Parece que fue ayer cuando empezamos a hablar de bots, chatbot, asistentes de voz…pero la realidad es que llevamos ya muchos años con estos conceptos entre nosotros. Ya en 1966 Eliza sorprendía haciendo de bot psicólogo y en los ‘90 estos ‘bots’ organizaban los objetos en categorías para hacer conversaciones temáticas.

Un ejemplo del crecimiento exponencial de los chatbots en estos años podemos verlo en este gráfico extraído de Google Trends:

Chatbots

Tenemos una nueva forma de comunicación, a través de las plataformas de mensajería, en las que podemos crear aplicaciones que nos automaticen acciones del día a día, cómo buscar información o añadir un evento a tu calendario por medio de mensajes de voz. A día de hoy, estamos rodeados por estos smart assistants, como es el caso de Siri (Apple), Alexa (Amazon), Google Assistant…

¿Qué son estos términos y cómo diferenciamos unos de otros?

Lo primero es tener claras las diferencias cuando hablamos de cada uno de ellos. Cada uno cumple la definición del anterior y le añade mayor funcionalidad.

Un bot es una aplicación que no tienes que instalar, que se ejecuta en el servidor y que interactúa contigo para automatizar una acción. Un chatbot es un bot, capaz de simular una conversación con una persona a través de un chat y un smart assistant es un chatbot es capaz de realizar acciones con comandos de voz, estos últimos aprenden y mejoran continuamente su repertorio de acciones.

Y… ¿por qué construir esto?

Existen distintas plataformas de mensajería que ya están abiertas al desarrollo del bots, las más importantes en función del número de usuarios en España son Facebook, Telegram, Google Assistant y recientemente Whatsapp.

Podemos ver en esta imagen de ‘We are social’ de 2019, el dominio en cada uno de los países de las plataformas de mensajería a nivel mundial, donde habría que incluir también WeChat, Line o Viber por número de usuarios totales:

chatbot

La idea parte de procesar el lenguaje, tanto el texto como la voz que estas plataformas permiten, y sacar de ahí la acción o ‘intención’ que el cliente quiere realizar. Para ello utilizamos distintos motores de procesamiento del lenguaje, actualmente el más popular es DialogFlow de Google por su facilidad de implementación y su potencia, pero también sus competidores están al acecho con grandes actualizaciones para idioma castellano, como Wit.ai, L.U.I.S de Microsoft, Amazon Lex (Motor NLP de Alexa) o IBM Watson.

Para nosotros, la versatilidad de Dialogflow tanto para desarrollar cualquier plataforma de mensajería, como la potencia para el idioma castellano y la posibilidad de configuración (sin entrar en tarifas, que también) nos han hecho decantarnos en la mayoría de desarrollos por el motor de Google.

Una comparativa bastante actualizada entre estas plataformas la podemos observar en https://www.kommunicate.io:

chatbots

 

¿Cómo funciona este procesamiento del lenguaje natural?

Este procesamiento se hace a través de Machine Learning, mediante análisis morfológicos, sintácticos, semánticos y pragmáticos. La finalidad de todo este proceso es sacar una “intención” de una frase (y ponerla en contexto), junto con sus entidades correspondientes, para que el motor que lo procesa tenga toda la información necesaria para ejecutar alguna acción. Si queréis encontrar más acerca de este proceso, os recomendamos este artículo en el que se puede ver varios ejemplo de cómo se procesa una frase mediante varias fases.

Evolución y casos de éxito: Nuestra experiencia

A finales de 2015 y principios de 2016 cuando empezamos a realizar nuestros primeros acercamientos a chatbots para Telegram y Facebook ni siquiera usábamos estos motores de procesamiento del lenguaje, únicamente experimentamos con las plataformas de mensajería con botones, que eran nuestro “procesamiento del lenguaje natural”. Ahí realizamos pruebas incluyendo posibilidad de incluir algunas frases y procesando manualmente algunos textos con pequeños desarrollos en backend para darle algo de humanización.

Empezamos a investigar con Wit.ai y Api.ai (que tras la compra por parte de Google sería Dialogflow) y sinceramente, nos habríamos quedado con Wit.ai, pero la posibilidad de hacer algo decente en castellano únicamente en Api.ai y su evolución a DialogFlow (que fue como cambiar de producto) nos hizo decantarnos por este.

Ya en 2018, nos interesamos por los smart assistants, e incorporamos la voz a este procesamiento, que sólo era añadir una fase más a este primer procesamiento, ya que al final, lo que nos interesa para el backend es la intención de esa frase, tanto en texto como en voz.

Con la llegada de Alexa, Google Home y sus versiones con pantalla, se nos abrió un mundo de posibilidades, y como no, una nueva forma de pensar en cómo montar todo de nuevo (mentes inquietas…). El mayor cambio fue el cambio de arquitectura del planteamiento inicial.

dialogflow

Ya no queríamos que DialogFlow fuera quien gestionará “qué hacer”, sino utilizar una capa antes que nos indicara la acción. Es decir, ponemos un orquestador antes y utilizamos DialogFlow como un API. De esta forma, dejamos abierta la puerta a otras integraciones, como una aplicación móvil con su propio backend, que solo necesita la acción a realizar, o cualquier otra integración que no sea las que tiene DialogFlow. Por ejemplo, probar con Whatsapp (con el que aún no hay integración) o meter un API para traducir los textos en idiomas que no entienda DialogFlow, como Euskera, Catalán, Gallego, etc.

Riesgos en el desarrollo, ¿con qué nos vamos a encontrar?

Dada la naturaleza del sector tecnológico, tendríamos que tener en cuenta:

  • Actualizaciones constantes: Estamos en un proceso de constante evolución, más aún de la que el sector tecnológico de por sí tiene. Habría que tener en cuenta una arquitectura que permita la actualización lo suficientemente agnóstica a la tecnología que utilicemos.
  • Privacidad: Los datos al trabajar con proveedores externos, pueden quedar en evidencia. Estos datos pasan tanto por la plataforma de mensajería (Facebook, por ejemplo) como por lo motores de procesamiento (Google, Amazon, etc…). Cuidado con los datos sensibles.

En definitiva, es evidente que el avance y el uso de estos smart assistants es exponencial, y que para cualquier empresa es un nuevo y desconocido canal de comunicación con el cliente, pero tenemos que plantearnos los riesgos que podemos asumir. A día de hoy y con las actualizaciones constantes de cada plataforma (tanto de mensajería como de procesamiento del lenguaje), se hace difícil predecir cuál es la apuesta definitiva, pero desde luego que si tenemos en cuenta “calidad/precio”, el gigante de Google tiene, de esta carrera tecnológica, una muy buena parte ganada.

Las opiniones vertidas por el autor son enteramente suyas y no siempre representan la opinión de BBVA Next Technologies.

¿Quieres saber que más cosas hacemos en BBVA Next Technologies?

Utilizamos cookies propias y de terceros para mejorar nuestros servicios, brindarle una grata experiencia y mostrar a los usuarios publicidad relacionada con sus preferencias mediante el análisis de sus hábitos de navegación. Si continúa navegando por este sitio web, consideramos que acepta su uso. Puede cambiar la configuración u obtener más información accediendo a nuestra política de cookies aquí.