Mistral выпустила дешёвую модель для транскрибации речи, которая работает на смартфоне

Опубликовано: 04:17, 06.02.2026

Парижский стартап Mistral AI представил две модели распознавания речи Voxtral Transcribe 2, которые работают локально на устройствах пользователя и обрабатывают аудио в десять раз быстрее конкурентов при пятикратно меньшей стоимости. Модели обрабатывают аудио на устройстве без передачи данных на сервер, что критично для медицины, финансов и госсектора Стоимость транскрибации через API составляет $0,003 за минуту для пакетной


обработки и $0,006 для реального времени Задержка в режиме реального времени настраивается до 200 миллисекунд против двух секунд у Google Две модели для разных задач Mistral разделила технологию на два продукта. Voxtral Mini Transcribe V2 обрабатывает записанные файлы пакетами и поддерживает 13 языков — английский, мандаринский китайский, японский, арабский, хинди и несколько


европейских. Компания заявляет о минимальном проценте ошибок распознавания слов среди всех сервисов транскрибации на рынке. Стоимость через API — $0,003 за минуту, что в пять раз дешевле крупных конкурентов. Voxtral Realtime работает с живым звуком при задержке от 200 миллисекунд. Эта модель распространяется под открытой лицензией Apache 2.0 — разработчики скачивают веса с Hugging Face, модифицируют их и разворачивают


без лицензионных платежей Mistral. Для тех, кто предпочитает не управлять собственной инфраструктурой, доступ через API стоит $0,006 за минуту. «Сообщество открытого кода очень изобретательно, когда речь идёт о приложениях. Нам интересно посмотреть, что они сделают», — сказал Пьер Сток, вице-президент Mistral по научным операциям, в интервью VentureBeat. Обработка на устройстве решает проблему конфиденциальности Решение создать


модели настолько компактными, чтобы они работали локально, отражает расчёт на то, куда движется корпоративный рынок. По мере того как компании интегрируют ИИ в чувствительные рабочие процессы — транскрибацию медицинских консультаций, звонков финансовых консультантов, юридических показаний — вопрос о маршруте


данных становится критическим. Сток описал проблему существующих приложений для ведения заметок с аудиофункциями: они улавливают посторонний шум неконтролируемым образом. Система может записать текст песни на фоне, захватить чужой разговор или галлюцинировать из-за фонового шума. Mistral вложила значительные ресурсы в курирование обучающих данных и архитектуру модели для решения этих проблем. Компания добавила корпоративные функции, которые американские конкуренты


внедряли медленнее. Контекстное смещение позволяет клиентам загрузить список специализированной терминологии — медицинского жаргона, фирменных названий продуктов, отраслевых аббревиатур — и модель автоматически отдаст приоритет этим терминам при транскрибации неоднозначного аудио. В отличие от дообучения, требующего переобучения модели, контекстное


смещение работает через простой параметр API. «Вам нужен только текстовый список. И тогда модель автоматически сместит транскрибацию в сторону этих аббревиатур или странных слов. Это работает без примеров, не требует переобучения, не требует сложных манипуляций», — объяснил Сток. Модель размером


всего 4 миллиарда параметров достаточно мала, чтобы работать на ноутбуке, телефоне или умных часах. Это позволяет обрабатывать голос и его транскрипцию там, где находится пользователь, не передавая данные на удалённые серверы — особенность, которая может оказаться решающей для компаний в регулируемых отраслях вроде здравоохранения, финансов и оборонной промышленности. От заводских цехов до


колл-центров Сток описал два сценария применения технологии. Первый касается промышленного аудита: техники обходят производственное предприятие, осматривают тяжёлое оборудование и выкрикивают наблюдения сквозь шум заводских механизмов. Задача — справиться с «технической


лексикой, которую никто не способен правильно написать, кроме этих людей», и получить на выходе заметки с временными метками и идентификацией говорящих, сохраняя высокую устойчивость к шуму. Второй сценарий нацелен на операции клиентской поддержки. Когда человек обращается в службу поддержки, Voxtral Realtime транскрибирует


разговор в реальном времени, передавая текст в бэкенд-системы, которые находят соответствующие записи о клиенте до того, как звонящий закончит объяснять проблему. «Статус появится у оператора на экране до того, как клиент закончит предложение и перестанет жаловаться. Это значит, что вы можете сразу взаимодействовать и сказать: «Хорошо, я вижу статус. Позвольте мне исправить адрес и отправить посылку обратно»», — объяснил Сток. Он оценил, что


это может сократить типичные взаимодействия службы поддержки с нескольких обменов репликами до двух: клиент объясняет проблему, и агент немедленно её решает. Перевод в реальном времени может появиться к концу 2026 года Несмотря на фокус на транскрибацию, Сток прояснил, что Mistral рассматривает эти модели как фундаментальную технологию для более амбициозной цели — естественного перевода речи в речь в реальном времени. «Возможно, конечное целевое приложение, под которое


модель закладывает основу, — это живой перевод. Я говорю по-французски, вы говорите по-английски. Минимальная задержка критична, иначе вы не построите эмпатию. Ваше лицо окажется не в синхронизации с тем, что вы сказали секунду назад», — сказал он. Эта цель ставит Mistral в прямую конкуренцию с Apple и Google, которые также работают над


этой проблемой. Последняя модель перевода Google работает с задержкой в две секунды — в десять раз медленнее, чем заявляет Mistral для Voxtral Realtime. Mistral позиционирует себя как приватную альтернативу для корпоративных клиентов Mistral занимает необычную позицию на ИИ-ландшафте. Основанная в 2023 году выходцами из Meta* и Google DeepMind, компания привлекла более $2 миллиардов и сейчас оценивается примерно в $13,6 миллиарда. Тем не менее она


работает с долей вычислительных ресурсов, доступных американским гипермасштабным компаниям, и построила стратегию вокруг эффективности, а не грубой силы. «Модели, которые мы выпускаем, соответствуют корпоративному уровню, являются лидерами отрасли, эффективны — особенно с точки зрения стоимости — могут встраиваться на


периферию, открывают приватность, открывают контроль, прозрачность», — сказал Сток. Этот подход нашёл отклик особенно у европейских клиентов, опасающихся зависимости от американских технологий. В январе Министерство вооружённых сил Франции подписало рамочное соглашение, дающее военным страны доступ к ИИ-моделям Mistral — сделка, которая явно требует развёртывания на контролируемой Францией инфраструктуре. Конфиденциальность данных остаётся одним из крупнейших


барьеров для внедрения голосового ИИ в корпоративной среде. Для компаний в чувствительных отраслях — финансах, производстве, здравоохранении, страховании — отправка аудиоданных на внешние облачные серверы часто неприемлема. Информация должна оставаться либо на самом устройстве, либо внутри собственной инфраструктуры компании. Конкуренция с OpenAI, Google и растущим Китаем Рынок транскрибации стал крайне конкурентным. Модель Whisper от OpenAI превратилась в отраслевой


стандарт, доступна через API и как загружаемые веса с открытым исходным кодом. Google, Amazon и Microsoft предлагают корпоративные речевые сервисы. Специализированные игроки вроде Assembly AI и Deepgram построили существенный бизнес, обслуживая разработчиков, которым нужна надёжная масштабируемая транскрибация. Mistral утверждает, что новые модели превосходят всех их по точности тестов, одновременно снижая цену. «Мы


лучше их в бенчмарках», — сказал Сток. Независимая проверка этих утверждений займёт время, но компания указывает на производительность в FLEURS, широко используемом многоязычном речевом бенчмарке, где модели Voxtral достигают процента ошибок распознавания слов на уровне альтернатив от


OpenAI и Google или лучше. Возможно, ещё важнее то, что генеральный директор Mistral Артур Менш предупредил, что американские ИИ-компании сталкиваются с давлением с неожиданного направления. Выступая на Всемирном экономическом форуме в Давосе в прошлом месяце, Менш отверг представление о том, что китайский ИИ отстаёт от Запада, назвав его «сказкой».


«Возможности технологий Китая с открытым исходным кодом, вероятно, напрягают генеральных директоров в США», — сказал он. Французский стартап делает ставку на доверие Сток предсказал, что 2026 год станет «годом ведения заметок» — моментом, когда ИИ-транскрибация станет настолько надёжной, что пользователи будут полностью ей доверять. «Вам нужно доверять модели, и модель в принципе не может допустить ни одной ошибки, иначе вы просто потеряете доверие к продукту и перестанете его


использовать. Порог супер, супер жёсткий», — сказал он. Преодолела ли Mistral этот порог, ещё предстоит увидеть. Корпоративные клиенты станут окончательными судьями, и они склонны двигаться медленно, проверяя заявления реальностью перед тем как выделить бюджеты и рабочие процессы под новую технологию. Аудио-площадка в Mistral Studio, где разработчики могут


протестировать Voxtral Transcribe 2 со своими файлами, заработала сегодня. Но более широкий аргумент Стока заслуживает внимания. На рынке, где американские гиганты конкурируют, вбрасывая миллиарды долларов во всё более крупные модели, Mistral делает другую ставку: в эпоху ИИ меньше и локальнее может победить больше и дальше.


Для руководителей, которые проводят дни, беспокоясь о суверенитете данных, соответствии регуляциям и привязке к поставщику, это предложение может оказаться убедительнее любого бенчмарка. Гонка за доминирование в корпоративном голосовом ИИ больше не только о том, кто построит самую мощную модель. Речь о том, кто построит модель, которой вы готовы позволить слушать. * Принадлежит компании Meta, она признана


экстремистской организацией в РФ и её деятельность запрещена.


Mistral выпустила дешёвую модель для транскрибации речи, которая работает на смартфоне

Сообщает itzine.ru

 

Новость из рубрики: Технологии и Hi-Tech

 

Поделиться новостью: Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

 

Топ Новости Недели Топ Новости Недели

 

Можно ли устанавливать новую версию WhatsApp, которая работает без замедления 21:17, 27 Янв Можно ли устанавливать новую версию WhatsApp, которая работает «без замедления»? Мошенники активно адаптируют старые схемы под аудиторию iPhone, и в последнее время это особенно заметно на примере WhatsApp*. Пользователям устройст...

Anthropic выпустила ИИ-модель Claude Opus 4.6 20:17, 06 Фев Anthropic выпустила ИИ-модель Claude Opus 4.6 Anthropic анонсировала Claude Opus 4.6 – свою наиболее продвинутую языковую модель на данный момент. По заявлению разработчика, новая версия предлага...

Apple Music занимает много памяти на iPhone Включите эту скрытую функцию и освободите место на смартфоне 21:17, 27 Янв Apple Music занимает много памяти на iPhone? Включите эту скрытую функцию и освободите место на смартфоне Если вы активно пользуетесь Apple Music и регулярно скачиваете треки для офлайн-прослушивания, со временем приложение может начать занимать неожиданн...

Жена купила в Фикс-Прайсе дешевую лапшу за 25 рублей: а я сделал с ней блюдо, которое элита в ресторанах заказывает 00:17, 31 Янв Жена купила в «Фикс-Прайсе» дешевую лапшу за 25 рублей: а я сделал с ней блюдо, которое "элита" в ресторанах заказывает Фото из архива "Pro Город"Автор Дзен-канала Домашняя кухня Алексея Соколова поделился рецептом приготовления удона. Предыстория такая: супруга автора...

За деньги  да. Германию на Олимпиаде-2026 представит модель с OnlyFans 10:17, 28 Янв За деньги — да. Германию на Олимпиаде-2026 представит модель с OnlyFans Представления об идеалах олимпизма, которые и сто лет тому назад были довольно специфическими, в XXI веке изменились кардинально. Сегодня участниками...

Модель из Москвы Лана Пожидаева вербовала русских девушек для Джеффри Эпштейна 17:17, 04 Фев Модель из Москвы Лана Пожидаева вербовала русских девушек для Джеффри Эпштейна Модель из Москвы Лана Пожидаева (настоящее имя — Светлана) оказалась главным рекрутёром россиянок для осуждённого за секс-торговлю и совращение несов...

Google готовит операционную систему, которая объединит ChromeOS и Android 04:17, 04 Фев Google готовит операционную систему, которая объединит ChromeOS и Android Google разрабатывает новую операционную систему под кодовым названием Aluminum, которая окончательно объединит платформы ChromeOS и Android для ноутб...

Дочь Любови Толкалиной, которая недавно развелась с мужем, заподозрили в беременности 23:17, 03 Фев Дочь Любови Толкалиной, которая недавно развелась с мужем, заподозрили в беременности Дочь Любови Толкалиной Мария Михалкова-Кончаловская, которая недавно развелась с мужем, якобы беременна. На днях 47-летняя Толкалина с 24-летней Мари...

14:17, 27 Янв TikTok в США не работает второй день из-за отключения электричества TikTok USDS сообщила, что проблемы с сервисом начались из-за отключения электричества в дата-центре партнёра и последующего каскадного сбоя систем — ...

18:17, 01 Фев Что означает «военная сертификация» гаджетов, и работает ли она на деле Сегодня всё больше брендов громко заявляют о защите по стандарту MIL-STD-810G, особенно в сегменте смартфонов и ноутбуков. Эта маркировка подаётся ка...

23:17, 06 Фев Купила в Фикс Прайс посуду для квартиры, которая сдается в аренду: рассказываю, что от нее осталось за 2 месяца Прогород Фикс Прайс и посуда — союз, который обычно встречают скептической усмешкой. Ожидания прозрачны: потрескается, облезет, сколется после первой...

13:17, 06 Фев Что за мессенджер imo, о котором все говорят? Он работает в России и поддерживает звонки Сегодня мессенджеры в России обсуждают чаще, чем погоду. Оно и понятно: когда сервисом пользуешься каждый день, да еще и по работе, любые тормоза пре...

13:17, 06 Фев Как включить Айфон, даже если не работает кнопка блокировки Если Айфон выключен, включить его в обычной ситуации проще простого. Самый очевидный способ знают почти все: достаточно зажать кнопку блокировки и по...

00:17, 31 Янв Почему эффект плацебо работает, даже если человек знает, что это пустышка Пустышка, которая работает: научный парадокс эффекта плацебо. Источник изображения: tgstat.ru Кажется, что плацебо — это обман: дали пустышку, челове...

13:17, 07 Фев «Предлагаю Диане Дэвис настучать на соседей». Журова дала совет фигуристке, которая пожаловалась на курящих в Олимпийской деревне Депутат Госдумы, олимпийская чемпионка по конькобежному спорту Светлана Журова дала совет спортсменам, проживающим в Олимпийской деревне Милана-2026....

13:17, 05 Фев Базовый iPhone 17 с аккумулятором 3692 мАч работает на одной зарядке так же, как OnePlus 15 с батареей 7300 мАч Комплексные тесты батарей, проведённые CNET в течение 2025 года, выявили бренды, которые выделяются на рынке смартфонов по времени автономной работы....

06:17, 28 Янв Ларионов о СКА: «119 минут не забивали, много для команды, которая обеспечена финансами. Я ищу ответ. Хотел бы выйти сам и забить, но я могу только на тренировке или с любителями» Главный тренер СКА Игорь Ларионов высказался о поражении от « Локомотива » (1:3) и низкой результативности команды. – Пять поражений подряд, еще и ма...

06:17, 06 Фев Почему ожидание боли сильнее реальной боли: как работает мозг Страшнее не боль, а её ожидание: мы сильнее страдаем до боли, а не во время неё. Вы наверняка это знаете по себе. Визит к стоматологу ещё не начался,...

09:17, 27 Янв Audeze выпустила планарно-магнитные наушники LCD-5s за $4500 Audeze анонсировала флагманские наушники LCD-5s. Усовершенствованная планарно-магнитная система излучателей обеспечивает гарнитуре невероятно точное ...

11:17, 07 Фев Алеся Кафельникова выпустила песню о личных переживаниях 27-летняя Алеся Кафельникова пробует себя в качестве певицы. Модель выпустила песню Ego Problems и опубликовала кадры из клипа.Кафельникова рассказал...

04:17, 04 Фев Tesla выпустила более доступную полноприводную Model Y Tesla продолжает снижать порог входа для покупки своих электромобилей, выпуская более доступные версии. Недавно компания представила Model 3 за 29 00...

14:17, 27 Янв Apple выпустила обновления для iOS, в том числе для 13-летнего iPhone 5s Apple выпустила iOS 12.5.8 для старых устройств, которые не получили обновление до iOS 26. Этот апдейт включает обновления сертификатов, позволяющие ...

19:17, 28 Янв Microsoft выпустила второе внеплановое обновление для Windows 11 Похоже, январские накопительные обновления для Windows 11 принесли с собой больше проблем, чем исправлений. Чтобы исправить ошибки, Microsoft вынужде...

22:17, 28 Янв Baseus выпустила Nomos NH21 – зарядную станцию «6 в 1» на 245 Вт Китайский бренд Baseus представил настольную зарядную станцию Nomos NH21 «6 в 1», разработанную для пользователей, которые одновременно работают с не...

18:17, 29 Янв Motorola выпустила смартфоны G17, G17 Power, G67 и G77 на чипах Dimensity Бренд Motorola анонсировал на международном рынке сразу четыре новых смартфона: Moto G77, Moto G67, Moto G17 и Moto G17 Power. Модели G67 и G77 относ...

22:17, 04 Фев Logitech выпустила игровую гарнитуру G325 с автономностью до 24 часов Logitech официально представила игровую гарнитуру G325 LIGHTSPEED с беспроводной технологией подключения LIGHTSPEED, поддержкой 24-битного звука и со...

17:17, 07 Фев Nvidia выпустила бета-версию приложения GeForce NOW для Linux Nvidia выпустила нативное приложение GeForce NOW для Linux в бета-режиме. На данный момент оно поддерживает системы на базе Ubuntu 24.04 и новее. По ...

22:17, 28 Янв Intel наконец выпустила XeSS 3 с поддержкой многокадровой генерации Intel начала распространение поддержки XeSS 3 – нового поколения своей ИИ-технологии масштабирования изображения с функцией многокадровой генерации. ...

21:17, 30 Янв Black Shark выпустила тонкий магнитный пауэрбанк Blade 3 Бренд Black Shark представил в Китае портативный магнитный аккумулятор Blade 3 ёмкостью 10 000 мАч. Новинка отличается высокой устойчивостью к ударам...

20:17, 06 Фев Acer выпустила игровой ноутбук Shadow Knight Neo с 300-герцевым экраном Acer представила на китайском рынке ноутбук Shadow Knight Neo 16, ориентированный на геймеров и создателей контента из среднего и верхнего ценового с...

14:17, 27 Янв Apple выпустила AirTag 2 с увеличенной дальностью связи и громким динамиком Apple представила второе поколение трекера AirTag с улучшенными характеристиками для отслеживания потерянных вещей. Новинка получила чип сверхширокоп...

04:17, 06 Фев Philips выпустила игровой монитор Evnia 27M2N5500XD с частотой до 1000 Гц Компания Philips запустила в Китае игровой монитор Evnia 27M2N5500XD и раскрыла полные характеристики одной из самых быстрых моделей на рынке. Новинк...

14:17, 27 Янв IKEA выпустила светодиодную настольную лампу Grejsimojs в форме собаки IKEA представила новую светодиодную настольную лампу Grejsimojs на рынках Северной Америки и Европы. Новинка отличается ярким и игривым дизайном, сме...

14:17, 27 Янв Samsung выпустила Galaxy Z Flip 7 Olympic Edition для зимних Игр в Милане Samsung представила Galaxy Z Flip 7 Olympic Edition для зимних Олимпийских и Паралимпийских игр Milano Cortina 2026 — смартфон получат бесплатно окол...

09:17, 27 Янв Apple выпустила AirTag 2 с увеличенной дальностью действия и громким звуком Apple выпустила новое поколение AirTag спустя почти пять лет после дебюта трекера в 2021 году. Главные изменения коснулись двух компонентов: громкост...

18:17, 01 Фев AOC выпустила новый флагманский 4K-монитор с Mini LED и двумя режимами работы AOC запустила в продажу новый игровой монитор Agon AG275UXM2. Это старшая модель в линейке AGON с 27-дюймовой Fast IPS-матрицей формата 16:9 и нативн...

22:17, 04 Фев Anker выпустила портативную электростанцию Solix C2000 Gen 2 ёмкостью 2048 Втч Anker официально представила портативную электростанцию Solix C2000 Gen 2. Устройство ориентировано на любителей активного отдыха, владельцев автодом...

14:17, 27 Янв HP выпустила игровой ноутбук HyperX Omen 15 с функцией самоочистки от пыли HP объявила о запуске игрового ноутбука HyperX Omen 15. Ключевой особенностью новинки стала защита от накопления пыли внутри корпуса, дополненная выс...

13:17, 06 Фев Apple выпустила iOS 26.3 Release Candidate. Когда обновление на iPhone выйдет для всех? Вечером, 4 февраля, Apple выпустила iOS 26.3 Release Candidate — финальную тестовую сборку новой операционки. Она появилось спустя всего 3 бета-верси...

17:17, 27 Янв Apple наконец выпустила AirTag 2. Что изменилось и как новая GPS-метка удивит владельцев Apple Watch Мы уже привыкли к тому, что Apple часто посвящает своим новым устройствам целые презентации. Но так происходит не всегда — планшеты частенько выходят...

18:17, 29 Янв Xiaomi выпустила Redmi Turbo 5 и Turbo 5 Max с батареей на 9000 мАч Xiaomi анонсировала в Китае два новых смартфона – Redmi Turbo 5 и Redmi Turbo 5 Max. Основной упор компания сделала на производительность и время авт...