En los Datos confiamos: IA, IA conversacional y bots

Ya todos sabemos eso de que “los datos gobiernan el mundo”. Por lo general, eso se refiere a la  inteligencia artificial (IA) y machine learning. Es un concepto del que se habla mucho y se implementa poco. Y el fiel reflejo de eso son las empresas que abordan el tema a nivel superficial o que no prestan la suficiente atención a los datos antes de embarcarse en proyectos de IA, frecuentemente a través de bots.

Este es el primero de una serie de blogs que analiza los aspectos que deben tenerse en cuenta respecto de los datos de IA. Analizaremos cómo Genesys atiende estas cuestiones y cuáles fueron las lecciones aprendidas en el camino.

Dónde empezó el amor de la IA por los datos

En la década de 1980, la tecnología de reconocimiento de voz sentó las bases de cómo la IA trabaja con los datos hoy. A pesar de que inicialmente reconocía solo números, los gobiernos de EE. UU. y Europa realizaron un esfuerzo conjunto para desarrollar esta tecnología. Su objetivo era hacer que los datos estuvieran disponibles para la investigación y basarla en algoritmos. La curación de datos de investigación, a pesar de ser un proceso tedioso y que insume mucho tiempo, permitió innovar para mejorar la precisión utilizando técnicas de modelado estadístico.

Hoy en día se ha avanzado muchísimo en la “visión de la computadora”, que captura información de las imágenes o los datos multidimensionales. Esto fue impulsado por académicos y gobiernos que buscaban proporcionar datos para realizar investigaciones. MNIST e ImageNet son buenos ejemplos de esos datos. Sin embargo, la visión de la computadora es bastante diferente de la IA conversacional. La cantidad de formas en las que los humanos se comunican verbalmente, la complejidad de las modalidades como la voz, y la semántica de las conversaciones que no siempre están bien definidas convierten a la IA conversacional en todo un desafío.

Lo que existe hoy no es suficiente

Desafortunadamente, la IA conversacional carece de datos de investigación, y esto afecta a la industria en general y a Genesys en particular. La falta de datos hace que sea difícil comparar la tecnología de los voicebots, chatbots y de los distintos tipos de sistemas asistidos por agentes. Por ejemplo, comparemos la manera en que usted reconoce las intenciones de los clientes cuando hablan con un asistente de voz como Alexa o Cortana. La intención ha sido diseñada para un bot del sector bancario, a modo de ejemplo. Si no lo hace, sería como comparar una silla de living con un sillón para odontología. Calibrar los algoritmos para que los bots realicen determinadas tareas no es suficiente para poder implementar la tecnología de nuestros clientes, que tienen necesidades más profesionales y orientadas a las tareas.

Todos los datos disponibles para la investigación tienen puntos débiles, incluidos los siguientes:

  • La mayoría de los conjuntos de datos de investigación son muy específicos de cada tarea.
  • Los conjuntos de datos externos no permiten testear las funciones que son específicas para lo que desarrolla Genesys.
  • Los buenos conjuntos de datos — o veces aquellos que tienen más cobertura de los medios— sirven más para demostrar cómo deben verse los datos que para desarrollarlos o compararlos. Por ejemplo, el conjunto de datos bAbl para las tareas de diálogo de Facebook cuenta con solo 1.000 diálogos anotados. Eso no es suficiente para muchos algoritmos. Lo que sí hace es mostrarnos cómo deben anotarse esos datos.
  • Los conjuntos de datos reales están en manos de los grandes como Google, Facebook y Microsoft, y, de ahí surge que puedan tener un desempeño excepcional masivo en algunas tareas complicadas. Reúnen, limpian, repiten y producen resultados. Pero no suelen poner esos datos a disposición para consumo público, especialmente para uso comercial, hasta que no obtengan la participación de mercado que desean por ser los precursores/inventores.

Genesys y la recolección de datos para IA

A medida que Genesys desarrolla tecnologías de IA y machine learning que pasan a formar parte de nuestra cartera de productos, tuvimos que enfrentar este desafío de los datos para los bots. Hay mucho conocimiento que vale la pena compartir sobre los insights que capturamos durante todo este trayecto, tales como definir un sector adecuado para el bot, capturar las complejidades que reflejen los casos de uso típicos en la industria, expresar empatía y definir los KPI para IA y experiencias del usuario.

Esta serie de blogs destaca las facetas de nuestro trabajo y las lecciones aprendidas para compartir con aquellos que se embarcan en proyectos de recolección de datos.

Expectativas y metas de los proyectos

Frente a estos desafíos, establecimos varias metas. Primero, necesitábamos un conjunto de datos que cubriera la funcionalidad que esperamos de los sistemas de IA conversacional en general, como cantidad razonable de intenciones, algunas intenciones con entidades, desambiguación y confirmación de bots.

Este conjunto de datos también debe medir el éxito de un bot desde varias perspectivas; por ejemplo:

  • Comprensión del Lenguaje Natural para satisfacer la creciente expectativa de que las conversaciones se asemejen más a las humanas
  • Solidez ante los errores en la transcripción de las interacciones de voz
  • Facilidad para completar la tarea. Es importante crear bots que agilicen y simplifiquen las tareas, sin un sinfín de confirmaciones y reconfirmaciones.

Esperamos que esto sea no solo una suerte de plantilla para planificar otros métodos de recolección de datos, sino también una serie de mejores prácticas para nuestros clientes. Por último, esperamos que, a través de este conjunto de datos, los clientes puedan percibir de inmediato el increíble valor que aporta nuestra tecnología de IA. Creemos que es tan valioso como un documento informativo que describa los principales KPI para los clientes.

Como los algoritmos evolucionan con el tiempo, este conjunto de datos puede también ser parte de la prueba de regresión. Con algoritmos de IA que aprenden de los datos, una prueba de regresión es una buena medida de protección. Por ejemplo, puede evitar que por accidente hagamos cambios de código que, si bien son buenos para una cosa, pueden afectar la funcionalidad en otras áreas. Esto es crucial para el desarrollo de software con DevOps.

Los datos que deseamos y cómo los conseguiremos

Comenzamos esta iniciativa creando un bot para el sector bancario que utiliza situaciones generadas a partir de nuestro conocimiento de la industria y sus requisitos específicos. Simulamos situaciones reales propias de la industria y recogimos nuestro propio conjunto de datos conversacionales en el sector bancario.

Los empleados de Genesys usaron el bot para que realizara tareas sin saber, o sabiendo poco, sobre cómo interactuar. El foco estaba puesto en lo que los bots deben enfrentar en el mundo real. El sector bancario ha sido de los primeros en adoptar la autogestión con IA, por eso utilizamos ese sector para este trabajo.

En los Datos confiamos

Implementar IA en su empresa es más que entrenar a un bot para que realice una tarea. Es un proceso continuo en el cual su bot, si está bien diseñado, puede aprender constantemente y mejorar las interacciones con sus clientes.

Según los datos que capturamos y analizamos sobre la forma en que los usuarios interactúan con nuestro bot, estamos aprendiendo cuál es su nivel de eficacia y qué debemos hacer luego. Esto incluye el diseño del bot, mejoras de los algoritmos y el desarrollo de funciones que se alineen con lo que nuestros socios y clientes necesitan.

En los próximos blogs de esta serie, analizaremos más detalles y los aspectos de los datos que estamos recogiendo. Echaremos una mirada también a nuestras métricas de desempeño y en qué áreas recurrimos a otros productos y empresas, como Google Dialogflow.

Comience su journey de IA en uno de nuestros  workshops “Cree un bot”.

Compartir: