В сервисе «VK Звонки» добавили расшифровку текстом во время разговора

. Также появились автоматические субтитры. Все это делает нейросеть

В сервисе «VK Звонки» добавили расшифровку текстом во время разговора и субтитры

Обновлено 29 августа 2023, 16:04
Shutterstock
Фото: Shutterstock

Функция расшифровки автоматически переводит звуковую дорожку в текст, который можно найти в чате звонка после его окончания. Такая новая возможность появилась в сервисе «VK Звонки», говорится в официальном релизе компании VK. За новый функционал отвечают нейросети. Они же обеспечивают опцию автоматических субтитров, которые будут дублировать речь участников звонка в ходе встречи, если это необходимо пользователям. Видеть такие субтитры будут только те участники созвона, которые самостоятельно их включили.

«Нейросеть умеет определять разных спикеров и разделять речь на предложения. Текстовую расшифровку можно запустить вместе с субтитрами и записью звонка. Новые функции также доступны в сессионных залах и в звонках от имени сообщества. Автоматический перевод аудио в текст работает с речью на русском, в дальнейшем команда добавит и другие языки».

Как пояснили разработчики нового функционала, для обеспечения высокого качества расшифровки аудиопоток проходит несколько этапов обработки:

  • запись очищается от фоновых звуков с помощью интеллектуального шумоподавления,
  • нейросеть распознает слова,
  • затем формирует из них текст,
  • делит речь на предложения в соответствии с конкретным спикером.

После окончания встречи файл с текстом придет в чат звонка и будет сохранен в специальном разделе в профиле пользователя, запустившего функцию. В файле расшифровки автоматически расставляются тайм-коды и имена говорящих. Нейросети постоянно совершенствуются и учатся в том числе на актуальной разговорной речи и сленге, пояснили в VK.

Пресс-служба ВКонтакте
Фото: Пресс-служба ВКонтакте

«Новые возможности будут особенно полезны, когда нужно быстро расшифровать интервью, отправить ключевые тезисы после встречи или рассказать об итогах звонка коллегам, которые не смогли присутствовать. Субтитры выручат, если важно соблюдать тишину, а под рукой нет наушников. Кроме того, это шаг к формированию доступной цифровой среды для слабослышащих пользователей: они смогут участвовать во встречах без ограничений».

Сегодня же стало известно, что мессенджер WhatsApp (принадлежит компании Metа, которая признана в России экстремистской организацией и запрещена) готовится внедрить новую опцию для повышения приватности звонков. По данным профильного портала WABetaInfo, пользователи в будущем смогут скрыть свой IP-адрес при звонках и станет сложнее отследить фактическое местоположение звонящего. Вызовы будут проходить через серверы WhatsApp, и результатом такой ретрансляции может оказаться незначительное снижение качества связи.

Ранее образовательная платформа VK Education объявила набор на бесплатные курсы для начинающих IT-специалистов. Об этом РБК Life рассказали в пресс-службе VK. Осенью стартуют три бесплатные образовательные программы. Слушатели курсов смогут углубить знания в Python и разработке веб-сервисов на Golang, а также получить навыки специалиста технической поддержки.

Поделиться