Análisis de voz y tecnologías GPT. 4 escenarios de integración útiles para empresas.
SIGURD IT continúa una serie de artículos sobre plataformas de voz y productos creados sobre su base. En este artículo hablaremos sobre tecnologías de procesamiento del lenguaje natural: modelos generativos que utilizan modelos de lenguaje grandes. Un modelo de lenguaje grande es una tecnología moderna en el campo de la inteligencia artificial que se utiliza para el procesamiento de textos. Un modelo de este tipo incluye miles de millones de parámetros entrenados en enormes cantidades de datos de texto, lo que permite comprender y generar lenguaje natural con gran precisión y naturalidad.
Muchos se han encontrado con Big Language Models mientras se comunicaban con los últimos chatbots, creaban sus propios textos creativos o editaban correos electrónicos. Sin embargo, hoy nos centraremos en las herramientas B2B en la industria de los centros de contacto y veremos cómo los modelos de lenguaje grandes pueden ayudar a fortalecer el análisis del habla y así brindar nuevos beneficios a las empresas en el área de mejorar la experiencia del cliente.
Se trata de la generación automática de un resumen de una llamada o chat en base a los resultados de una sesión de atención al cliente. Las interacciones en el centro de contacto duran varios minutos, escucharlas lleva mucho tiempo, leer la transcripción y charlar también. ¡Qué tentador sería conseguir una amplia condensación de la comunicación entre un cliente y un operador de 1000 palabras a 20−30! Esto es lo que hará GPT, convirtiendo cientos de frases de diálogos en texto compacto de 5 a 7 oraciones. Ahorrar tiempo y centrarse en las cosas más importantes son sólo algunas de las ventajas de este caso. El grado de compresión del texto y el grado de libertad al parafrasear está determinado por los parámetros del modelo de lenguaje grande. La calidad también depende del tamaño del modelo. La regla funciona aquí: cuantos más parámetros incluya el modelo, mayor será la calidad de la suma. Por ejemplo, los modelos con 7 o 70 mil millones de parámetros difieren en la calidad del texto generado y la comprensión del contexto.
El tercer escenario, técnicamente más complejo, se sitúa en el ámbito de la evaluación automática de llamadas. Imagine que tiene varios miles de llamadas con NPS alto o bajo y desea extrapolar estos datos al conjunto completo de interacciones. Gracias a la tecnología GPT esto es posible. En este caso, preparamos una muestra de textos y calificaciones de clientes y los cargamos en el sistema como una muestra adicional, después de lo cual podemos pedirle al sistema que califique automáticamente las llamadas que no fueron calificadas. De esta manera, aseguramos una cobertura del 100% de toda la base de llamadas y podemos identificar tanto las mejores como las peores prácticas de servicio.
Технически более сложный, третий сценарий лежит в плоскости автоматической оценки звонков. Представьте, что у вас есть несколько тысяч звонков с высоким или низким NPS, и вы хотите экстраполировать эти данные на все множество взаимодействий. Благодаря технологии GPT это становится возможным. В этом случае мы готовим выборку текстов и проставленных клиентами оценок и загружаем их в систему в качестве дополнительной выборки, после этого мы можем попросить систему автоматически оценить звонки, которые оценены не были. Тем самым мы обеспечиваем 100% покрытие всей базы звонков и можем выявить как лучшие, так и худшие практики обслуживания.
Это использование больших языковых моделей в реал-тайм аналитике. В этом сценарии система, получив текст от клиента (голосовой или текстовый канал связи), подсказывает оператору наиболее подходящий ответ (следующую лучшую реплику). Как и в случае с написанием программного кода (системы, аналогичные GitHub Copilot) оператор сам принимает решение, использовать ли ему рекомендацию или нет; процент согласий с ИИ (ключевая метрика при оценке эффективности системы автоматических подсказок) достигает 50%. Рассмотрим на примере: клиент спрашивает о цене на товар, а система выводит на экран наиболее удачную формулировку ответа на запрос. В этом сценарии мы повышаем конверсию в эффективные звонки, одновременно снижая когнитивное напряжение оператора, что важно в часы пиковой нагрузки.
Приведенные примеры кейсов сравнительно легко достижимы даже с использованием стандартных Больших языковых моделей как open source, так и доступных в формате облачного сервиса. Далее поговорим о более сложных сценариях, когда Большая языковая модель дополняется генерацией с дополненной выборкой (Retrieval Augmented Generation). Этот метод призван улучшить качество генерации текста путем комбинации знаний, содержащихся в базовой Большой языковой модели, и информации из других источников (База знаний, история коммуникаций и др.). Например, в системах чат-ботов благодаря этой методике предоставляем пользователю более релевантный ответ на его вопрос, исходя не только из общих “знаний”, заложенных в Большую языковую модель, но и конкретного набора пар “вопрос-ответ” в базе знаний компании.
С удовольствием проведем для вас демонстрацию продукта, в которой покажем, как Большие языковые модели работают в рамках системы речевой аналитики и обсудим аналитические кейсы, специфичные для вашей компании. Оставьте заявку на демонстрацию системы.
Ведущий эксперт речевых технологий SIGURD IT