Question 1

Какая точность транскрибации на русском?

Accepted Answer

Диктуй использует Whisper Large-v3-turbo через Groq — это та же базовая модель, что у Wispr Flow и SuperWhisper. На чистой русской речи (диктор, подкаст, интервью без шумов) точность 95-98%. На записях с фоновым шумом, акцентом или быстрой речью — 88-93%. На mixed RU+EN речи (типичной для IT и vibe coding) — 92-96%, что значительно выше встроенных решений Windows/macOS, которые на mixed теряют 30-50% качества.

Question 2

Какие форматы аудио и видео поддерживаются?

Accepted Answer

Аудио: MP3, WAV, M4A, OGG, FLAC. Видео: MP4, WebM (Диктуй автоматически извлечёт аудиодорожку). Telegram-голосовые в OGG работают «из коробки» — просто перетащите файл из мессенджера в окно Диктуй. Лимит размера файла — 2 часа аудио или ~500 МБ. Длинные файлы автоматически разбиваются на чанки и транскрибируются параллельно.

Question 3

Можно ли транскрибировать бесплатно?

Accepted Answer

Да. Free-тариф Диктуй даёт 30 минут транскрибации в месяц **навсегда** — без карты, без trial-периода, без скрытых лимитов. Этого достаточно, чтобы попробовать на реальном файле и понять подходит ли. Если нужно больше — Pro 299₽/мес (300 мин), Unlimited 599₽/мес (без лимита). Все тарифы оплачиваются картами МИР, СБП и зарубежными — без прокси-карт.

Question 4

Как перевести аудио в текст бесплатно?

Accepted Answer

Бесплатно перевести аудио в текст можно на Free-тарифе Диктуй — 30 минут расшифровки в месяц навсегда, без карты и без trial-периода. Перетащите MP3, WAV, M4A или OGG в окно приложения и получите готовый текст. Этого хватает, чтобы расшифровать короткое интервью, голосовое сообщение или фрагмент лекции. Если записей больше — Pro 299₽/мес (300 минут) или Unlimited 599₽/мес.

Question 5

Можно ли перевести аудио в текст онлайн без установки?

Accepted Answer

Онлайн-сервисов «аудио в текст» в браузере много, но почти все либо режут русский на бесплатном тарифе, либо просят валютную карту, либо грузят файл на чужой сервер без понятной политики хранения. Диктуй — десктоп-приложение: ставится за минуту на Windows и macOS, работает быстрее браузерных конвертеров (час аудио за 1–3 минуты через Groq) и оплачивается картами МИР и через СБП. Текст результата хранится в вашем кабинете на серверах в РФ по 152-ФЗ.

Question 6

Какой программой перевести аудио в текст на компьютере?

Accepted Answer

Для русского языка на компьютере подойдёт любая программа на базе Whisper Large-v3 — это сейчас лучшая по точности модель распознавания речи. Диктуй — готовое десктоп-приложение с такой моделью: drag-and-drop файла, экспорт в TXT, DOCX и субтитры SRT, поддержка mixed RU+EN речи. Встроенные средства Windows (Win+H) и macOS (Apple Dictation) расшифровку готовых файлов не умеют — они работают только с живым микрофоном.

Question 7

Где хранятся файлы и обрабатываются персональные данные?

Accepted Answer

Файлы загружаются на сервера Groq (США) только на время транскрибации — после получения результата они удаляются автоматически. Текстовый результат хранится в вашем личном кабинете на серверах в РФ (Beget VPS) согласно требованиям 152-ФЗ о локализации персональных данных граждан РФ. Подробнее — в [политике конфиденциальности](/privacy). Для медицинских записей и юридических документов с особо чувствительными данными мы не рекомендуем использовать облачную транскрибацию — это касается всех сервисов на Whisper, не только Диктуй.

Question 8

Чем транскрибация в Диктуй отличается от Я.SpeechKit и GigaChat?

Accepted Answer

Я.SpeechKit и GigaChat — это API для разработчиков, без готового UI. Чтобы расшифровать MP3, нужно написать код на Python, отправить файл через REST, получить JSON, разобрать его. Диктуй — десктоп-приложение с drag-and-drop: перетащил файл → получил готовый текст в окне с возможностью копирования и экспорта в TXT/DOCX/SRT. Целевая аудитория Я.SpeechKit — разработчики и контактные центры; Диктуй — обычные пользователи, журналисты, копирайтеры, vibe-coder'ы, юристы.

Question 9

Можно ли экспортировать в субтитры (SRT) для видео?

Accepted Answer

Да. После транскрибации видеофайла Диктуй сохраняет временные метки сегментов и предлагает экспорт в SRT (стандартный формат субтитров для YouTube, Premiere, Final Cut, DaVinci) и VTT (для веб-плееров). Если расшифровывали аудио (без видео) — экспорт доступен в TXT (просто текст) и DOCX (с разбиением по говорящим, если они различимы по интонации).

Question 10

Сколько времени занимает транскрибация часа аудио?

Accepted Answer

На Whisper Large-v3-turbo через Groq — час аудио расшифровывается за 1-3 минуты благодаря параллельной обработке чанков. Это в 5-10 раз быстрее, чем у конкурентов на не-Groq инфраструктуре (Sonix, Otter тратят 10-20 минут на час). Если сервер Groq перегружен (пиковые часы), может занять до 5 минут — но это всё равно радикально быстрее ручной расшифровки (которая занимает 4-6 часов на час записи).

Сервис	Цена	Точность RU	Платформы	Оплата
Диктуй	0₽ (30 мин) → 299₽/мес Pro	95%+ (Whisper Large-v3-turbo)	Win + Mac	МИР, СБП, карты
Voicy	$8.49/мес или $220 lifetime	Whisper (облачный)	Win + Chrome	Только валютная карта
Sonix	$10/час с файла	Whisper / собственный движок	Только web	Карты в долларах
Otter.ai	$16.99/мес Pro	Собственный движок (плох на русском)	Web + iOS/Android	Карты в долларах

Аудио в текст: транскрибация и расшифровка на русском

Как перевести аудио в текст и зачем это нужно

Транскрибация, расшифровка, перевод аудио в текст — это одно и то же?

Как работает в Диктуй: 3 шага

Перетащите файл

Whisper Large-v3 расшифровывает

Готовый текст

Точность на русском в 2026: конкретные цифры

Поддерживаемые форматы

Кому пригодится: 6 реальных сценариев

Интервью и подкасты

Лекции и вебинары

Совещания и встречи

Заметки голосом

Видеоконтент

Журналистика и юриспруденция

Сравнение с другими сервисами транскрибации

Сколько стоит транскрибация в Диктуй

Часто задаваемые вопросы

Попробуйте бесплатно — 30 минут навсегда