Автоинформатор

Как научить автоинформатор говорить по-человечески

Большинство автоинформаторов и голосовых меню до сих пор звучат ненатурально. Причина заключается в том, что их фразы собираются из отдельных фрагментов, которые записываются вне контекста конечных фраз.

Пример того, как звучит обычный автоинформатор в системе электронной очереди:

 Люди так не говорят.

Во-первых, независимо от того, что мы хотим сказать — признаемся в любви, ворчим, размышляем вслух, возмущаемся, спрашиваем, отвечаем и пр. — мы всегда строим законченные фразы. Подобно музыкальной фразе устная реплика всегда имеет свой цельный интонационный рисунок и подчиняется внутреннему темпоритму.

Во-вторых, даже заученную фразу мы никогда в не произнесем абсолютно одинаково дважды.

Если же фраза собирается из отдельных фрагментов, ее темпоритм нарушается, а интонация скачет:

Чтобы речь автоинформатора приобрела черты человечности, необходимо выполнить ряд условий:

  1. Фразы должны строиться из крупных блоков, созданных из записанных целиком фраз или по крайней мере крупных частей фраз. Это позволит выстроить единый интонационный рисунок фразы.
  2. Длительность пауз в начале и конце блоков должна быть такой, чтобы при стыковке любых элементов естественный ритмический рисунок фразы не нарушался.
  3. Фразы должны иметь вариативность.

Часть 1. Подготовка скрипта

Допустим, в системе электронной очереди формируются три независимых потока, максимальная длина каждого — 99 человек. Количество работающих окон, (стоек, кабинетов, касс, терминалов) — 8. Традиционный скрипт имел бы подобную структуру:

Вместо того, чтобы записывать одно предложение с двумя пропусками и отдельным набором цифр и букв, разобьем фразу на цельные части.

Теперь сформируем новый скрипт, в котором фразы собираются только из двух блоков.

Часть 2. Запись и монтаж

Записываем несколько пробных дублей, выбираем парочку с самым естественным темпоритмом. В мультитрекере подкладываем румтон, амбиенсные звуки и звуковой сигнал, чтобы , как сообщения будут восприниматься в офисной суете.

Все-таки лучше иметь небольшой люфт между буквой и цифрой. Учтем это при записи всего материала.

После того, как записаны все элементы, помечаем маркерами удачные дубли. Сразу же продумываем схему наименования маркеров, так как их имена будут использоваться при пакетном экспорте файлов.  Старательно чистим выбранные дубли, избавляясь от любых артефактов записи (микрощелчки, “слюни”, вздохи, искажения).

Те фразы, в которых интонация требует правки, помечаем и перезаписываем.

Выставляем все элементы на тайм-линию и проверяем, что все фразы звучат ровно. Тишину в  окончаниях файлов делаем одинаковой длины, чтобы любой файл из  блоков AA, AB, AC подходил к любому файлу из блока B.

Еще раз проверяем, как звучат сообщения в реальной обстановке.

<Можно слушать. Дело за малым — экспортировать 300 файлов. Применяем компрессию, эквализацию, немного колдуем с пространственной обработкой и настраиваем пакетный рендер в WaveLab.

Результат

Нам потребовалось две объемных сессии записи. На монтаж ушло в несколько раз больше времени, чем на редактирования обычного ivr-скрипта. Но в итоге наш информатор говорит почти как образованный и воспитанный человек, которого приятно слушать. Его речь естественна и дружелюбна.

Сравним его с “неочеловеченной” версией:

Совершенству нет предела

Голосовые меню, фразы в которых строятся по скриптам из длинных блоков, можно продолжать “очеловечивать”. Это требует определенной смелости от заказчика, но позволяет сделать системы автоинформирования еще ближе к человеку.

Живой работник обращается к каждому посетителю по-разному, просто потому что произносить одну и ту же фразу в течение рабочего дня — сущее мучение.

Мы можем заканчивать фразу тоже по-разному, рандомно выбирая варианты:

  • Посетитель с номером А23, подойдите к стойке номер 4.
  • Посетитель с номером А24, ждем вас у стойки номер 2.
  • Посетитель с номером B17, пройдите к стойке номер 7.

Если в электронной очереди регистрируются по картам или ID, то есть система идентифицирует посетителя, мы заменяем блок с номером посетителя на его имя. Для этого потребуется регулярно дозаписывать имена клиентов, но для тех, кто ценит красоту, это не станет препятствием. Только представьте:

  • Пушкин Александр Сергеевич приглашается в кабинет номер 12.
  • Чехов Антон Павлович, ждем вас у стойки номер 6.
  • Гоголь Николай Васильевич, пройдите к стойке номер 11.