[Авторская] [Windows|MacOS] Whisper Voice Machine (голос → под курсор, видео → в конспект) [Lifetime] [ProPractic] [Повтор-1]

ProPractic · 15 мар 2026

[Windows|MacOS] Whisper Voice Machine (голос → под курсор, видео → в конспект) [Lifetime] [ProPractic][Повтор-1]

Ваш Персональный Командный Центр с поддержкой MCP
Предыдущий поток

История о том, как я выбросил клавиатуру после 16 лет слепой печати и заставил AI работать на меня...

У вас тоже есть эта папка? "Разобрать позже"?

Давайте честно, мы находимся на Складчике, и все мы немного страдаем "синдромом хомяка". У каждого из нас на жестком диске лежат сотни гигабайт "мертвого груза", до которого просто не доходят руки. Это курсы, которые "надо глянуть на выходных", записи вебинаров по 3-4 часа и бесконечные аудио-лекции.

Вы скачали их, потому что там есть ценность и вы за неё заплатили, но у вас физически нет времени смотреть 3 часа "воды", чтобы найти 5 минут "мяса". В итоге эти знания не работают на вас, они просто занимают место на диске и вызывают чувство вины за потраченные средства. Пора остановить этот бесконечный цикл отложенной жизни.

А теперь представьте другую реальность.
Вы берете папку с 10-часовым видео-курсом, перетаскиваете файлы в окно программы и спокойно идете заваривать чай. Whisper Voice Machine начинает "слушать" эти файлы в ускоренном режиме, пока вы отдыхаете. Возвращаетесь, а у вас перед глазами полный, структурированный текст, в котором вы мгновенно находите ответ на свой вопрос.

Вы можете получить великолепного качества перевод, субтитры, красиво форматированный конспект, или даже отслеживать указать папки для авто-отслеживания...

Whisper Voice Machine (WVM)
Ваш комбайн по переработке сырого контента и мыслей в структурированную базу знаний.

Почему я перестал печатать (владея слепой печатью 16 лет)?

Я разработчик, и мои пальцы бегают по клавиатуре быстрее, чем у 90% людей, чем я всегда гордился. Но 3 месяца назад я понял страшную правду: печать - это главное "узкое горлышко" моей продуктивности. Я думаю быстрее, чем печатаю, и пока я формулирую мысль, правлю опечатки и тянусь к Backspace - идея ускользает или мутирует.

Я написал WVM, чтобы убрать этого неуклюжего посредника (клавиатуру) между моим мозгом и компьютером навсегда. Теперь я просто нажимаю кнопку на мыши, откидываюсь в кресле, закрываю глаза и говорю все, что приходит в голову. Программа не просто записывает звук, она думает за меня, превращая поток сознания в готовый документ.

Три режима использования
Узнайте себя в одном из них

Для "Коллекционеров Знаний" (Складчиков)
Перестаньте копить гигабайты, начните их монетизировать и применять здесь и сейчас.
Сценарий: У вас есть запись зум-созвона, купленный курс или длинная лекция на английском.
Магия: Закиньте файл в WVM (Drag & Drop). Через несколько минут у вас есть текстовая расшифровка и перевод. Или еще проще. Просто скажите программе отслеживать определенные папки на вашем компьютере и обрабатывать новое автоматически! (NEW! Включая скриншоты)
Результат: Попросите AI сделать саммари: "Выдели главные инсайты и составь список задач". Вы "посмотрели" 2-часовое видео за 5 минут чтения.

Для SMM, Копирайтеров и Креаторов
Вам знакомо чувство "чистого листа", когда курсор мигает, а в голове звенящая пустота?
Решение: Пойдите гулять с собакой или мыть посуду, надиктовывая поток идей, обрывки фраз и шутки в телефон.
Обработка: Пришли, закинули аудио в WVM и применили промт "Сделай пост в стиле Ильяхова".
Итог: Черновик готов, вам остается только опубликовать, превращаясь в настоящую фабрику контента. (NEW! Включая работу с картинками и фотографиями!)

Для Управленцев и Менеджеров
Вас бесят бесконечные переписки и созвоны, но вы обязаны соблюдать корпоративный этикет?
Действие: Нажмите хоткей и выплесните эмоции: "Скажи этому <цензура>, что он сорвал все сроки, и мы расторгаем договор!".
Результат: В чат вставляется идеально выверенное, холодное и юридически грамотное письмо. Ваша нервная система скажет вам спасибо, а репутация останется безупречной. Или доставайте информацию из длинных созвонов за считанные минуты!

Ваш технологический арсенал

1. Тотальный отказ от ручной печати
Диктуйте везде: Word, Telegram, Браузер, IDE, Notion. Где мигает курсор - туда летит идеальный текст. Вы сами пишете промты для обработки, создавая свой уникальный стиль через разные промпты пост-обработки текста!

2. "Пожиратель Курсов": Видео в Текст + Перевод
Купили крутой курс на английском, но уровень языка не позволяет смотреть в оригинале? Закиньте видео в WVM с промтом "Переводчик". Вы получите готовую методичку на родном языке. NEW! Вы можете получить идеально синхронизированные по таймингам таймкоды на родном языке!

3. Model Content Protocol (MCP Server)
Технология будущего, доступная сегодня.
WVM выступает сервером для ваших AI-агентов (Claude Desktop, IDE агенты).
Вы можете попросить Claude Desktop (или Open Code Desktop, или иную программу): "Проанализируй мои записи за прошлую неделю и найди идеи для стартапа". Агент сам залезет в вашу локальную базу, найдет нужное и даже откроет документ перед вами. Сделать саммари "сегодняшних заметок" или поискать "то самое видео про X и открыть его в программе."

А может быть вы хотите получить обзор большого видео-курса, агент соберет его для вас, просмотрев все расшифровки, и даже выдернет нужные кадры из видео-материалов (Извлечение кадров - в ближайших планах!)

4. Умный поиск и База Знаний
Все ваши мысли сохраняются локально. Мгновенный полнотекстовый поиск по архиву, фильтрация по датам. Ни одна гениальная мысль больше не потеряется. Ни один скриншот, аудио, или видео не будут лежать мёртвым грузом на диске!

Окно поиска: Ваша база знаний всегда под рукой

Настройки AI: Полная свобода в выборе моделей и промтов

Я уважаю ваше железо и кошелек, поэтому говорю как есть — без маркетингового обмана.

1) Распознавание (Уши) — 100% локально
Локально через ядро Whisper. Ваши файлы и голос никогда не уходят на чужие сервера. Абсолютная приватность.

Базовый вариант (без постобработки):
Вы можете выключить постобработку и работать почти что на любом современном компьютере.
Нужно примерно 8 ГБ ОЗУ и нормальный современный процессор. Начиная от Intel 8-го поколения — вообще комфортно. Но у меня это работает даже на Intel 4-го поколения.
Это самый доступный режим.

2) Постобработка (Мозги) — на ваш выбор

Вариант №2 — облачная постобработка (максимум качества на слабом ПК)
Если вы хотите постобработку, но у вас слабая машина — подключаете облачную LLM и получаете суперкачественную, супербыструю постобработку.
Пример: OpenRouter (Gemini Flash, DeepSeek и др.), сейчас поддерживается так же один из РФ посредников, без конских наценок. Оплата за рубли и СБП.
Экономика: обработка огромного лонгрида стоит пару центов, а вашей диктофонной записи — десятой цента.

Вариант №3 — локальная постобработка (тотальная приватность)
Если вы хотите постобработку локально и без облака — вам потребуется мощное железо.
Минимум: видеокарта от 8 ГБ VRAM — это режим для самых простых моделей постобработки.
Рекомендуется: 16 ГБ VRAM, если хотите действительно качественную постобработку и комфорт.
Из современных относительно недорогих вариантов — условная xx60 Ti на 16 ГБ.

Из протестированных мной моделей отлично себя показывают:
Qwen 3, 3.5 (4B и 8B), Gemma 3 (разные размеры).
Но если вы хотите очень качественную постобработку — лучше ориентироваться на 16 ГБ VRAM в локальном режиме.
Я сам чаще использую облачную постобработку (через OpenRouter), потому что у меня нет суперконфиденциальных данных.
Но если бы я был юристом или психотерапевтом — я бы использовал исключительно локальные варианты.

Системные требования (3 уровня)

1) Минимальные (базовый режим: только распознавание)
Для кого: если вам нужна расшифровка аудио/видео в текст, без постобработки LLM (без «улучшайзинга», саммари, задач и т.д.).

CPU: Intel Core от 4-го поколения (у меня работает на таком железе).

ОЗУ: 8 ГБ.

GPU: не обязателен (можно на CPU, просто будет медленнее).

Что вы получаете: абсолютную приватность и максимальную совместимость — подходит почти для любого «живого» ПК.

2) Комфортный (распознавание быстро и стабильно + облачная постобработка)
Для кого: если вы хотите «красивый» текст (саммари, инсайты, задачи, стиль письма), но ваш компьютер не тянет локальные LLM — вы подключаете облако (OpenRouter и т.п.).

CPU: Intel Core от 8-го поколения (или аналогичный современный Ryzen).

ОЗУ: 16 ГБ (можно 8 ГБ, но 16 — заметно спокойнее).

GPU: желательно Nvidia от 4 ГБ (например GTX 1050 Ti), чтобы распознавание шло комфортно. (Можно и без GPU, но медленнее.)

Интернет: нужен только для постобработки (распознавание всё равно локальное).

Что вы получаете: быстрый локальный Whisper + сверхкачественную постобработку «в облаке» за копейки.

3) Максимальный (тотальная автономность: распознавание + локальная постобработка)
Для кого: если вам нужна постобработка LLM строго локально (максимальная приватность) и вы хотите скорость/качество без облака.

ОЗУ: 32 ГБ (минимум 16 ГБ, но 32 — правильная база под локальные LLM).

GPU: Nvidia RTX с 16 ГБ VRAM — рекомендуется для качественной локальной постобработки (8 ГБ VRAM — минимум для самых простых моделей, но качество/комфорт ниже).

CPU: современный многоядерный (чем мощнее — тем лучше), но основной упор тут в GPU/VRAM.

Что вы получаете: полный «локальный комбайн» — и распознавание, и постобработка на вашей машине, без передачи текста/данных в облако. На моём Ryzen 7 5700x + 32bg ram + 3080 10gb vram простые локальные модели вполне неплохо крутятся.

Почему lifetimeI, а не подписка?

Я разработчик-одиночка, который пользуется своим продуктом каждый день. Западные аналоги (SuperWhisper, Otter) просят $15-20 в месяц вечно. Здесь, эксклюзивно на Складчике, вы получаете:

Пожизненную лицензию (Lifetime) на 3 ваших компьютера.

Пакет «Системных промтов» (SMM, деловой стиль, кодинг).

Прямую поддержку от автора в этой теме.

Гарантию безопасности: программа логирует только технические ошибки. Никаких личных данных, текстов или ключей никуда не отправляется.

Важно по-честному про обновления и поддержку:
Обновления — 3 месяца, поддержка — 6 месяцев (в рамках этой версии).
Я буду слушать пожелания, допиливать программу и собирать обратную связь — я готовлю продукт к релизу на международном рынке, и мне важно обкатать всё на живых сценариях.
На международном рынке LifeTime лицензия будет стоить вдвое дороже.
Код будет защищен через обфускацию. Привязка к железу. HDD (если не подошел) -> MAC сетевой карты.
У нас бывают случаи когда ни то ни другое не подхододит. Решается в индивидуальном порядке, но это редкость.

Вы получаете установщик, который установит софт на ваш компьютер (всё по взрослому))

Поддерживается Windows 11, Windows 10, Mac OS Tahoe (Чипы Apple M1 +++)

Не поддерживается:
- Серверные Windows
- Windows 7 (Я вообще без понятия кто им пользуется в 2026м)
- Linux (В теории можно но не тестировал) - будет в будущем...

Хватит печатать и копить информацию. Начните управлять ею.

Специальный бонус за рекламу
Сделайте 3 рекламных поста и получите расширенный пакет "Golden Pack" промтов

Внутри бонуса набор:

"Telegram-Машина" — посты из бубнежа.
"Корректор" — исправление ошибок с сохранением стиля.
"Деловая Акула" — жесткие юридические письма.
"Кодер" — оформление алгоритмов в чистый код.

Отзывы

Записывайтесь. В следующем повторе, цена будет выше. А на обновления мажорных версий вас будет ждать скидка.

Все экраны приложения.

Свежие скрины приложения
и немного устаревшие демо видео (будут свежие позже)

ProPractic · 17 мар 2026

@karhu привет!
Заметил тебя в участниках

Хотел уточнить что с Windows Server дела не поменялись. @Брат подсказал хорошие решения и пожелания для локальных серверов, но разделение на сервер с поддержкой Windows Server и тонкий клиент будет позже...
Поэтому хотел этот момент уточнить, чтобы не расстраивать тебя после покупки

karhu · 17 мар 2026

ProPractic сказал(а): ↑

@karhu привет!
Заметил тебя в участниках

Хотел уточнить что с Windows Server дела не поменялись. @Брат подсказал хорошие решения и пожелания для локальных серверов, но разделение на сервер с поддержкой Windows Server и тонкий клиент будет позже...
Поэтому хотел этот момент уточнить, чтобы не расстраивать тебя после покупки
Нажмите, чтобы раскрыть...

Привет. Мне специально серверная версия не нужна. Версия для MacOS - то, что надо.

alexandra8090 · 17 мар 2026

Добрый день! Хотела отдельно поблагодарить Вас за мак версию, это просто невероятно! Низкий поклон!!!

ProPractic · 17 мар 2026

karhu сказал(а): ↑

Привет. Мне специально серверная версия не нужна. Версия для MacOS - то, что надо.
Нажмите, чтобы раскрыть...

alexandra8090 сказал(а): ↑

Добрый день! Хотела отдельно поблагодарить Вас за мак версию, это просто невероятно! Низкий поклон!!!
Нажмите, чтобы раскрыть...

@alexandra8090, @karhu, версия Mac OS будет в первый раз выходить на Складчике, вероятно будут правки и улучшения, у нас с одним участником первого потока состоялся 2х недельный раунд он мне логи - я апдейты кода но в итоге все хорошо
Кажется я не описал ограничения - основное - это наличие чипа Apple M, даже на M1 должно работать, но на Intel процессорах (старые маки) - тут не смогу сказать наверняка.

С Mac OS все проще, там нет такого архитектурного безумия с микрофонами и OS, думаю что все будет несколько легче...

Alexey1488 · 19 мар 2026

почему этот повтор дороже ?

ProPractic · 19 мар 2026

Alexey1488 сказал(а): ↑

почему этот повтор дороже ?
Нажмите, чтобы раскрыть...

@Alexey1488,
Всё потому, что функций стало больше. Появилась версия на macOS, и программа стала гораздо более функциональной. В ней гораздо больше возможностей, чем было на том запуске. Также в описании первой темы я предупреждал, что цена будет выше.
Вы можете посмотреть на цену у конкурентов. Я видел подобный софт даже здесь, на Складчике, за цену вдвое выше.

ProPractic сказал(а): ↑

Записывайтесь. В следующем повторе, цена будет выше. А на обновления мажорных версий вас будет ждать скидка.
Нажмите, чтобы раскрыть...

И возможно в следующий раз будет так же.
Потому что я пилю крутую фичу, поиск по видеоряду

ProPractic · 19 мар 2026

alexandra8090 сказал(а): ↑

Добрый день! Хотела отдельно поблагодарить Вас за мак версию, это просто невероятно! Низкий поклон!!!
Нажмите, чтобы раскрыть...

@alexandra8090
Добрый день, спасибо большое. У меня самого есть MacBook, и мне было очень интересно изучить его возможности работы с нейросетями. Конечно, 8 ГБ объединённой памяти — это мало, как бы ни заверяла Apple об обратном, но этого вполне хватит для распознавания речи.

А вот для работы локальных моделей, конечно, этого маловато, и ноутбуку придётся очень туго. Думаю, оптимальный сценарий — подключить облачные нейросети для постобработки, а распознавание речи и базовая транскрипция будут замечательно работать на MacBook.

Единственное, что стоит иметь в виду: это объединённая память, то есть и видеопамять, и оперативная. Когда её всего 8 ГБ, это означает, что программа будет занимать 1,5–2 ГБ при работе.

Например, как браузер с двумя десятками открытых вкладок. И какие-то другие тяжёлые программы могут уже немного подтормаживать.

katena_slastena · 20 мар 2026

Добрый день! Будет ли возможность переработать так книги в краткий конспект (в том числе на английском)?

evgennsk154 · 20 мар 2026

Реклама:
1
2
3

ProPractic · 20 мар 2026

katena_slastena сказал(а): ↑

Добрый день! Будет ли возможность переработать так книги в краткий конспект (в том числе на английском)?
Нажмите, чтобы раскрыть...

@katena_slastena, добрый день! Программа в первую очередь про переработку аудио в текст. Два основных направления: диктовка под курсор, как, например, сейчас я говорю этот текст, так и массовая обработка файлов на вашем компьютере через перетягивание их на дропзону или через добавление папок для отслеживания, а именно: аудио, видео и изображение.

То есть, наш основной фокус — переработать медиаконтент в текст, иметь возможность точного, чёткого поиска по вашим материалам, как в рамках одного большого материала, так и подключить автоматизации в виде `Model Content Protocol` — инструментов для работы агентов на вашем компьютере.

Так что, если ответить коротко, то с книгами мы не работаем.

Rotanga · 20 мар 2026

На андроид или IOS встанет?

ProPractic · 21 мар 2026

ProPractic сказал(а): ↑

[Windows|MacOS]
Нажмите, чтобы раскрыть...

Rotanga сказал(а): ↑

На андроид или IOS встанет?
Нажмите, чтобы раскрыть...

Добрый день, увы, нет
Вычислительной мощности не хватит

Rotanga · 21 мар 2026

ProPractic сказал(а): ↑

Добрый день, увы, нет
Вычислительной мощности не хватит
Нажмите, чтобы раскрыть...

А если через облако, есть возможность подключить?

ProPractic · 21 мар 2026

Rotanga сказал(а): ↑

А если через облако, есть возможность подключить?
Нажмите, чтобы раскрыть...

Добрый день да можно будет подключить OpenRouter или российского поставщика (без конских наценок) с каталогом openrouter

Ну распознавание происходит исключительно локально на вашем железе

Поэтому есть опция использовать для постобработки облачные провайдером или же локальную машину для полной конфиденциальности

Azura · 21 мар 2026

На макос такая же полноценная версия, как и на виндоус? И как лицензия будет? У меня и пк и мак есть, возможно ли так?

И по функционалу:
Можно ли в него закидывать сразу весь какой-то тренинг и оно с разных медиафайлов сделает уже структуру/саммари/тудулисты?

ProPractic · 22 мар 2026

@Azura, добрый день

Azura сказал(а): ↑

На макос такая же полноценная версия, как и на виндоус? И как лицензия будет? У меня и пк и мак есть, возможно ли так?
Нажмите, чтобы раскрыть...

Будет полноценная версия; без проблем можно будет получить версии под разные операционные системы.

Azura сказал(а): ↑

Можно ли в него закидывать сразу весь какой-то тренинг и оно с разных медиафайлов сделает уже структуру/саммари/тудулисты?
Нажмите, чтобы раскрыть...

Можно будет перетягивать в дроп-зону отдельные папки с файлами или же просто определить папки для отслеживания: когда в них будут появляться какие-либо материалы, программа будет автоматически их обрабатывать. Либо эту очередь можно будет запускать вручную.

Сейчас я иду в сторону строгой синхронизации тайм-кодов, чтобы минимизировать изменение смысла между оригиналом и постобработкой. Но если захочется, без проблем можно будет заменить промпт и получать структуру, summary или TODO-листы. Однако я бы, наверное, рекомендовал получать полный текст и уже прогонять его через нейросети для дополнительной обработки.

Программа поддерживает Model Content Protocol сервера. И можно будет просто поручать агенту выполнение какой-то работы: он будет получать тексты разных файлов и по очереди их обрабатывать без проблем.

То есть автоматизация будет поддерживаться, но несколько иначе. Также я иду в сторону создания навыков для агентов, которые будут работать локально: вы сможете поднять локальных агентов, которые смогут работать с приложением, и таким образом автоматизировать самые разные процессы.

Azura · 22 мар 2026

ProPractic сказал(а): ↑

@Azura, добрый день

Будет полноценная версия; без проблем можно будет получить версии под разные операционные системы.

Можно будет перетягивать в дроп-зону отдельные папки с файлами или же просто определить папки для отслеживания: когда в них будут появляться какие-либо материалы, программа будет автоматически их обрабатывать. Либо эту очередь можно будет запускать вручную.

Сейчас я иду в сторону строгой синхронизации тайм-кодов, чтобы минимизировать изменение смысла между оригиналом и постобработкой. Но если захочется, без проблем можно будет заменить промпт и получать структуру, summary или TODO-листы. Однако я бы, наверное, рекомендовал получать полный текст и уже прогонять его через нейросети для дополнительной обработки.

Программа поддерживает Model Content Protocol сервера. И можно будет просто поручать агенту выполнение какой-то работы: он будет получать тексты разных файлов и по очереди их обрабатывать без проблем.

То есть автоматизация будет поддерживаться, но несколько иначе. Также я иду в сторону создания навыков для агентов, которые будут работать локально: вы сможете поднять локальных агентов, которые смогут работать с приложением, и таким образом автоматизировать самые разные процессы.
Нажмите, чтобы раскрыть...

Спасибо за подробные ответы.
А транскрибировав материал можно будет автоматически в n8n передать на сервере который?

ProPractic · 22 мар 2026

Azura сказал(а): ↑

Спасибо за подробные ответы.
А транскрибировав материал можно будет автоматически в n8n передать на сервере который?
Нажмите, чтобы раскрыть...

@Azura, спасибо за вопросы и интерес!
Доступен будет mcp, и n8n вроде умеет в mcp

Проверил через ИИ поиск:

Да — n8n поддерживает MCP. Причём сразу в обе стороны:
как MCP server: к n8n могут подключаться внешние MCP-клиенты и запускать/вызывать отмеченные workflow’ы;
как MCP client: в самом n8n есть узлы MCP Client и MCP Client Tool, через которые он может ходить к внешним MCP-серверам и использовать их инструменты

evgennsk154 · 26 мар 2026

Когда ориентировочно старт?

[Авторская] [Windows|MacOS] Whisper Voice Machine (голос → под курсор, видео → в конспект) [Lifetime] [ProPractic] [Повтор-1]

Отзывы участников