Западная встреча (Meet / Zoom)
Свой Workspace/org → нативные API (Meet REST / Zoom RTMS). Иначе Recall.ai-бот ($0.65/ч) → свой RU-STT. Готовый продукт — Fireflies / MeetGeek (русский тестировать).
Документ для команды: чем транскрибировать звонки и встречи на русском, что реально доступно из РФ под санкциями, сколько это стоит — и какие в итоге есть способы реализации. Без кода: только разбор движков, сравнение инструментов, цены и решения по сценарию.
Задача — транскрибировать звонки и встречи (преимущественно на русском) и получать на выходе текст с разделением по спикерам. Цель — собрать решение из существующих инструментов, а не писать STT с нуля. Три фактора переворачивают наивный выбор «возьмём Whisper и Otter»:
RU-специализированные модели GigaAM и T-one бьют Whisper-large-v3 на звонках примерно вдвое. На call-center: T-one 8.63% WER против Whisper 19–23%.
С 22.01.2026 ЕС запретил AI-сервисы в РФ; OpenAI банит RU-аккаунты; оплата с РФ-карт сломана. Деплоибельны без барьера только RU-native и self-hosted (§2).
У Telemost нет ни bot-API, ни media/transcript-API — только управление встречами. Единственный путь к транскрипту: запись → постобработка STT.
Дальше — три сравнительные оси: чем распознавать (движки/API), чем пользоваться «из коробки» (SaaS-нотейкеры), как достать аудио из звонка (захват по платформам). Каждая ось упирается в санкционный фильтр и в цену.
К санкционному запрету добавляются два практических блокера: OpenAI не включает РФ в список поддерживаемых стран и банит RU-аккаунты, а оплата западных сервисов с РФ-карт (Visa/MC российских банков) не работает — нужна иностранная карта или крипта.
developers.openai.com/api/docs/supported-countries (РФ не в списке поддерживаемых стран)
| Категория | Инструменты | Статус из РФ |
|---|---|---|
| RU-native облако | Yandex SpeechKit, SaluteSpeech (Sber) | ✓ без барьера |
| Self-hosted OSS | GigaAM, T-one, Whisper/faster-whisper, WhisperX, Vosk, NeMo | ✓ обходит санкции (свой сервер) |
| Западное облако | OpenAI, AssemblyAI, Google, Azure, ElevenLabs Scribe, Groq Whisper | ✗ юр. + платёжный риск |
| Западный on-prem | Deepgram (on-prem), Azure (контейнеры) | ⚠️ только если лицензия исполнима под санкциями |
Главный фильтр — колонка «Из РФ». Качество русского измеряется через WER (Word Error Rate, ниже = лучше), но честного кросс-провайдерного RU-бенчмарка не существует (см. оговорку ниже), поэтому ранги достоверны внутри одной таблицы, не между абсолютами.
| Провайдер | RU качество | Realtime | Диаризация | Self-host | Из РФ |
|---|---|---|---|---|---|
| Yandex SpeechKit RU | ~95–97% (не бенч.) | да | только 2 спикера | — | ✓ без барьера |
| SaluteSpeech (Sber) RU | сильное (не бенч.) | да | да, >2 | — | ✓ без барьера |
| ElevenLabs Scribe | 3.1% FLEURS (лучший) | да (без диариз.) | 48 спикеров | — | ✗ санкции |
| OpenAI Whisper API | 5.7% FLEURS | да | да (4o-diarize) | — (OSS да) | ✗ блок |
| AssemblyAI | слабый рассказ | RU c 03.2026 | да | — | ✗ санкции |
| Groq Whisper (large-v3) | = Whisper | да (managed) | нет | — | ✗ санкции |
| Deepgram Nova-3 | не публ. | да | да | ✓ on-prem | ✗ (on-prem ⚠️) |
| Azure AI Speech | не публ. | да | 35 спикеров | ✓ контейнеры | ✗ (контейнер ⚠️) |
Доступность из РФ: EU Art.5n / рег. 833/2014 · OpenAI supported-countries. Документация движков: Yandex SpeechKit · SaluteSpeech · ElevenLabs Scribe (ru)
| Проект | RU качество (WER) | Диаризация | Realtime | Железо | Лицензия |
|---|---|---|---|---|---|
| GigaAM-v3 (Sber) OSS | RU-SOTA · 0.9% CV / 9.5% call | нет (+ pyannote) | ограниченно | CPU-ok | MIT |
| T-one (T-Bank) OSS | call-center 8.63% | нет (+ pyannote) | да (300 мс) | CPU-ok | Apache-2.0 |
| Whisper / faster-whisper | 5.4% CV / 23% call | нет | батч | GPU (CPU слабо) | MIT |
| WhisperX | = Whisper | ✓ pyannote | батч | GPU | BSD-2 |
| Vosk | 4.4% crowd / 36% call | нет | да | CPU-only / edge | Apache-2.0 |
| NVIDIA NeMo | ~Whisper-tier (мультиязык) | ✓ Sortformer | да | GPU | Apache / CC-BY |
github.com/salute-developers/GigaAM · github.com/voicekit-team/T-one · openai/whisper · m-bain/whisperX · NVIDIA-NeMo · pyannote 3.1 (диаризация)
| Модель | CommonVoice ru | Golos Farfield | Call-center | Тип / доступ |
|---|---|---|---|---|
| GigaAM-v3 RNNT | 0.9 | 3.9 | 9.5 | OSS MIT · RU ✓ |
| GigaAM-v2 RNNT | 2.68 | — | 10.22 | OSS MIT |
| T-one (71M) | 5.32 | — | 8.63 | OSS Apache · стриминг |
| ElevenLabs Scribe | 5.5 | — | — | облако · 3.1 FLEURS · РФ ✗ |
| Whisper large-v3 | 5.4–5.78 | 16.4 | 19.4–23.1 | OSS MIT · generalist |
| Vosk-ru-0.42 | ~6.1 | 4.4 (crowd) | 36.0 | OSS · CPU/edge |
| Yandex SpeechKit | не публикует WER — ~95–97% accuracy (3rd-party) | облако · RU ✓ | ||
| SaluteSpeech | не публикует WER | облако · RU ✓ | ||
Если строить не хочется — есть готовые «нотейкеры»: подключаются ботом к звонку и отдают транскрипт + саммари. Главные фильтры для РФ: поддержка русского, поддержка Telemost и возможность оплаты.
| Сервис | Русский | Telemost | Захват | API | Из РФ (оплата) |
|---|---|---|---|---|---|
| mymeet.ai RU | да | ✓ бот-в-Telemost | бот | — | ✓ ₽ |
| Krisp | да | ✓ захват ОС-звука | без бота | слабый | карта ✗ |
| Fireflies | посредственно | только upload | бот + API | сильный | карта ✗ |
| MeetGeek | да | только upload | бот | API + MCP | карта ✗ |
| Sembly | да (заявл.) | только upload | бот | да (MCP) | карта ✗ |
| Read.ai | да (аналитика) | — | бот | да | карта ✗ |
| tl;dv | не подтв. | только upload | бот + desktop | слабый | карта ✗ |
| Notta | нестабильно | только upload | бот | спорно | карта ✗ |
| Otter.ai | нет русского | — | бот | слабый | карта ✗ |
STT-движок бесполезен без аудио. Три подхода: (A) бот в звонке, (B) запись → постобработка, (C) официальный API/SDK платформы. Возможности резко различаются по платформам — и именно Telemost ломает «бот»-подход.
| Платформа | Бот-в-звонке? | Нативная транскрипция (тариф) | Media / stream API? | Лучший путь |
|---|---|---|---|---|
| Google Meet | ✓ Recall / Puppeteer | Gemini (Business Standard+) | Conference Records REST · Media API = Dev Preview | свой Workspace → REST; иначе Recall-бот → свой STT |
| Zoom | ✓ Recall / SDK | Cloud Recording (Pro+) | ✓ RTMS (live, без бота) | свой org + realtime → RTMS; иначе Recall |
| Yandex Telemost | только mymeet.ai / DIY | «конспект» (Yandex 360, платно) | ✗ только управление встречами | запись .webm → SpeechKit / GigaAM |
| любая (incl. Telemost) | — | — | — | Krisp — захват системного звука ОС |
Цены приведены к сравнимым единицам: STT API и компьют → $/час аудио; SaaS и платформы → $/мес за пользователя (seat). Курс конверсии $1 = ₽79. «Бесплатный» open-source не бесплатен — платишь за компьют.
| Провайдер | Дешевейший батч | Streaming | Free / кредит | Из РФ |
|---|---|---|---|---|
| Yandex SpeechKit RU | $0.075 (₽9.14) | $0.32 (₽39) | грант ₽4–10k · 60 дн | ✓ |
| SaluteSpeech RU | ~$0.46 (₽36) | ~$0.46 | 100 мин/мес (физл.) | ✓ |
| AssemblyAI | $0.15 (U-2) | $0.45 (U-3) | $50 кредит | ✗ |
| OpenAI | $0.18 (4o-mini) | $1.02 (RT) | — | ✗ |
| Google STT | $0.24 (Dyn.Batch) | ~$0.96 std | 60 мин/мес | ✗ |
| Deepgram Nova-3 | ~$0.26 | ~$0.29 | $200 кредит | on-prem |
| Azure Speech | $0.36 (fast) | $1.00 (RT) | F0 5ч/мес | контейнер |
| ElevenLabs Scribe | $0.40 (v1) | $0.28 (v2 RT) | 10k кред./мес | ✗ |
Yandex SpeechKit pricing · SaluteSpeech tariffs · AssemblyAI · OpenAI · Google STT · Deepgram · Azure Speech · ElevenLabs
| Сервис | Free-тариф | Дешевейший платный | Русский | Из РФ (оплата) |
|---|---|---|---|---|
| mymeet.ai RU | 180 мин/мес | 850₽ (~$8) Lite | да | ✓ ₽ |
| MeetGeek | 3 ч/мес | $9.99 Pro | да | карта ✗ |
| Fireflies | транскрипт. безлим | $10 Pro | посредств. | карта ✗ |
| Sembly | триал | $10 Basic | да | карта ✗ |
| Notta | 120 мин/мес | ~$8.17 Pro | нестаб. | карта ✗ |
| Otter | 300 мин/мес | $8.33 Pro | нет | карта ✗ |
| Read.ai | 5 транскр./мес | $15 Pro | да | карта ✗ |
| tl;dv | безлим зап., 10 саммари lifetime | $18 Pro | да | карта ✗ |
| Krisp | только 7-дн триал | $8 Core | да | карта ✗ |
mymeet.ai · MeetGeek · Fireflies · Sembly · Notta · Otter · Read.ai · tl;dv · Krisp
| Сервис | Цена | Что даёт |
|---|---|---|
| Recall.ai | $0.65/ч (запись $0.50 + транскр. $0.15) | бот Meet/Zoom/Teams; первые 5ч free; без месячной платы |
| Zoom Pro | $13.33/польз/мес (год.) | cloud-запись + нативный транскрипт |
| Zoom RTMS | по запросу (sales) | live аудио + транскрипт без бота |
| Google Workspace Standard | $14/польз/мес (год.) | Meet-транскрипт + Gemini-конспект |
| Yandex 360 Минимальный RU | 319₽/польз/мес | AI-«конспект» + запись Telemost на Диск |
| Telemost локальная запись RU | 0₽ (любой тариф) | .webm для постобработки в свой STT |
Recall.ai pricing · Zoom · Zoom RTMS · Google Workspace · Yandex 360
| Опция | Цена компьюта | $/час аудио |
|---|---|---|
| GigaAM / T-one на CPU (своё железо) | $0 | ≈ $0 маржинально |
| GPU-аренда RTX 4090 | $0.18–0.69/ч | ~$0.02–0.03 |
| Groq Whisper large-v3-turbo | managed | $0.04 РФ ✗ |
| Fireworks / Groq large-v3 | managed | $0.05–0.19 |
| Replicate T4 | $0.81/ч | ~$0.10–0.20 |
Groq · Fireworks · Replicate · RunPod (RTX 4090)
На уровне выбора подхода (без деталей сборки) решение раскладывается на две оси: как достать аудио (захват) и чем распознать (STT-движок). Захват: запись / бот / нативный stream-API. Движок: self-host vs RU-облако vs западное (под санкциями).
≈ $0 маржинально без санкций
GigaAM (точность, CPU) или T-one (live-телефония) + pyannote для диаризации. RU-SOTA качество, данные не покидают инфру. «Цена» — инженерный сетап пайплайна.
без барьера быстрый старт
Yandex SpeechKit (дешевле всех — $0.075/ч; диаризация только 2 спик.) или SaluteSpeech (диаризация >2, но 15k ₽/мес минималка юрлиц). Без своего железа.
под санкциями
ElevenLabs Scribe / OpenAI / AssemblyAI / Groq — лучший WER, но юр.+платёжный риск (§2). On-prem Deepgram/Azure — теоретический «escape hatch» при исполнимой лицензии.
бот / запись / API
Meet/Zoom: Recall.ai-бот или нативные API (RTMS / Meet REST). Telemost: только запись → STT (нет media-API) либо готовый mymeet.ai-бот.
| Аспект | Self-host OSS | RU-облако | Западное облако |
|---|---|---|---|
| Маржинальная цена | ≈ $0 (CPU) / $0.02–0.03 (GPU) | $0.075–0.46/ч | $0.15–0.40/ч |
| Доступность из РФ | ✓ обходит санкции | ✓ без барьера | ✗ юр.+оплата |
| RU качество | RU-SOTA (GigaAM/T-one) | сильное (не бенч.) | лучший WER (Scribe) |
| Диаризация | + pyannote (отдельно) | Salute >2 / Yandex 2 спик. | да (48 спик. Scribe) |
| Старт | инженерный сетап | ключ API сразу | ключ + иностр. оплата |
Локальная запись Telemost (0₽) + GigaAM на CPU + pyannote. RU-SOTA без GPU, ≈ $0 маржинально, без санкций, данные не покидают инфру. Цена — инженерный сетап пайплайна.
Yandex SpeechKit (дешевле всех — $0.075/ч; минус — диаризация 2 спик.) или SaluteSpeech (диаризация >2, free 100 мин, но 15k ₽/мес минималка юрлиц). Захват Telemost — запись → API.
Свой Workspace/org → нативные API (Meet REST / Zoom RTMS). Иначе Recall.ai-бот ($0.65/ч) → свой RU-STT. Готовый продукт — Fireflies / MeetGeek (русский тестировать).
mymeet.ai — единственный нотейкер с ботом-в-Telemost, русский, диаризация, оплата ₽ (от 850₽/мес). Без бота для любой платформы — Krisp (захват ОС-звука).