SaluteSpeech Bot — мини-приложение в Telegram от компании Sber для распознавания речи из голосовых сообщений, видеосообщений и аудиофайлов. Использует технологию распознавания речи SaluteSpeech, обеспечивая точную транскрипцию на русском, английском и казахском языках. Основная цель — упрощение взаимодействия с аудиоконтентом без необходимости ручного ввода текста.
Как работает SaluteSpeech Bot
Мини-приложение SaluteSpeech Bot App интегрировано в Telegram и используется для преобразования аудио в текст. Пользователь отправляет голосовое сообщение, видео или аудиофайл, а бот возвращает текстовую расшифровку.
Сервис ориентирован на пользователей, которым нужно быстро обработать аудиоинформацию, например, для заметок, переводов или анализа. Бот работает в личных чатах, группах и каналах, поддерживая до 10 000 запросов в месяц для одного пользователя.
Технология основана на нейронных сетях, обученных на больших массивах данных, что обеспечивает точность распознавания до 95% для русского языка в оптимальных условиях.
Как пользоваться ботом
Для начала работы достаточно запустить мини-приложение через бота SaluteSpeech от Сбера и отправить аудиофайл. Интерфейс минималистичен: пользователь отправляет данные, ИИ обрабатывает их в течение 3–10 секунд в зависимости от длины файла (максимум 5 минут).
Поддерживаются форматы MP3, WAV, OGG. Команда /lang позволяет выбрать язык распознавания. Результат возвращается в виде текста в чате, без дополнительных действий. Мини-приложение Salute Speech не требует авторизации через сторонние сервисы, но для стабильной работы нужен устойчивый интернет.
Основные функции:
- Распознавание голосовых сообщений.
- Обработка видеосообщений.
- Транскрипция аудиофайлов.
- Выбор языка распознавания.
- Поддержка групповых чатов.
- Быстрая обработка до 10 секунд.
- Лимит 10 000 запросов.
- Высокая точность до 95%.
Уникальные возможности
Salute Speech Bot в Телеграм выделяется поддержкой трех языков, что редко встречается в аналогичных приложений. Технология позволяет распознавать не только четкую речь, но и диалекты, акценты и фоновый шум с точностью до 90% в сложных условиях.
Мини-приложение Сбер Салют Спич интегрируется с бизнес-аккаунтами Telegram, что полезно для автоматизации клиентских запросов. Например, компании могут использовать его для обработки голосовых заявок.
Ежемесячный лимит в 10 000 запросов покрывает потребности малого бизнеса или активных пользователей. Бот не поддерживает монетизацию или криптовалютные операции, фокусируясь исключительно на функциональности распознавания.
Как работает на практике
Пользователь отправляет голосовое сообщение, например, длительностью 30 секунд, и бот возвращает текст в течение 5 секунд. Если файл длиннее, обработка занимает больше времени, но не превышает 30 секунд для 5-минутного аудио.
В групповых чатах бот распознает сообщения от разных участников, сохраняя контекст. Техподдержка доступна через @speechbot_support, где отвечают в течение 1–2 часов. Мини-приложение не сохраняет данные после обработки, обеспечивая конфиденциальность. Для сравнения, аналогичные боты, такие как VoiceToTextBot, часто имеют ограничения по длине аудио или языкам.
Особенности
- поддержка трех языков;
- точность до 95%;
- обработка шумных аудио;
- интеграция с бизнесом;
- лимит 10 000 запросов;
- быстрая обработка;
- конфиденциальность данных;
- доступен бесплатно в Телеграм.