Доступно

[Windows] Whisper Voice Machine (голос → под курсор, видео → в конспект) [Lifetime] [ProPractic]

Тема в разделе "Бизнес и свое дело", создана пользователем ProPractic, 28 янв 2026.

Цена: 273240р.
Взнос: 4600р.
98%

Основной список: 67 участников

Статус обсуждения:
Комментирование ограничено.
  1. 30 янв 2026
    #21
    Пилот
    Пилот ЧКЧлен клуба
    Привет. С какими AI работает эта программа. С платными или бесплатными. Сколько они стоят?
     
    2 пользователям это понравилось.
  2. 30 янв 2026
    #22
    ProPractic
    ProPractic ОргОрганизатор (А)
    Добрый день. Вот то, что прямо сейчас вы видите, является начиткой на микрофон. Никакой постобработки. Работа происходит локально на вашем железе.

    Локальная модель Whisper 3 Large Turbo отдаёт подобный текст на русском языке с знаками припинания. Если вам нужна какая-то специфическая постобработка, эмодзики, жирный курсив, подготовка тегов для публикации на складчике, в Телеграме, творческая переработка контента, тогда нужна постобработка другой моделью.

    Локально - LM Studio + все что потянет ваше железо

    ---уже с обработкой---

    Эту модель можно запустить на вашем железе, если у вас мощное железо. Если такового нет, придется использовать удаленного поставщика.

    Сейчас есть только один вариант — OpenRouter. Но я могу добавить и другие варианты, в том числе российские провайдеры, которые проксируют доступ.

    Кстати, вот этот текст уже с небольшой постобработкой от модели Gemini 2.5 Flash-light, которая стоит десятую или сотую часть цента. Постобработка конкретно вот этого сообщения.

    (Разбивка на абзацы, длинные тире, особо сложные слова - это уже на ней. Постобработка стоила 0.00029 доллара)
     
    1 человеку нравится это.
  3. 30 янв 2026
    #23
    ProPractic
    ProPractic ОргОрганизатор (А)
    Технически можно было бы сделать выделение жирным для ключевых моментов, курсивом.

    Я собираюсь и такой промпт сделать для Складчика, но пока не добрался до этого.

    То, что я делал выше, обычно я просто руками проходился по тексту, оформляя жирный и курсив.

    Но теоретически это может делать модель, уже немножко подороже, допустим, Flash 3 от Google или иная подобная.
     
  4. 30 янв 2026
    #24
    Skladunok
    Skladunok ЧКЧлен клуба
    Гайд будет прилагаться как пользоваться всеми возможностями программы?
     
    1 человеку нравится это.
  5. 30 янв 2026
    #25
    ProPractic
    ProPractic ОргОрганизатор (А)
    Да, конечно :)
    Будет руководство пользователя с описанием всех параметров и рекомендациями по использованию, в том числе по подключению Model Content Protocol клиентов на примере нескольких программ.
     
    1 человеку нравится это.
  6. 30 янв 2026
    #26
    PlatonXXL
    PlatonXXL ЧКЧлен клуба
    @ProPractic
    Я хочу вашу программу. У мне нет денег. Я их потратил на годы покупки курсов на складчике. Но у мен горы курсов. Я болен, нету сил. Подарите мне вашу программу. Хочу подарок.(((,,,,,,я лью слёзы. Придется опять брать кредит. Помогите.
     
    8 пользователям это понравилось.
  7. 30 янв 2026
    #27
    Рома У
    Рома У ЧКЧлен клуба
    А если у меня есть годовая подписка на Клод? Значит я подрубаю через апи и делаю Саммари в вашей проге?
    И это расходует меньше токенов, чем если я закину обычный текст из видео и сделаю Саммари в самом клоде?
     
    1 человеку нравится это.
  8. 30 янв 2026
    #28
    ProPractic
    ProPractic ОргОрганизатор (А)
    Если ответить коротко, все будет зависеть от кейса использования. Если нужен просто summary, я думаю, что да. Даже по Open Router это будет дешевле, и вы не будете тратить запросы своего тарифа. Но в целом программа немножко про другое: это про диктовку под курсор, превращение в текст, аудио и видео информации и работу с ней. (В т.ч. автоматизированную через агентов по MCP)

    Если использовать Cloud Code или Cloud Desktop, можно будет подключить программу по MCP как клиент. Тогда появится возможность производить поиск в заметках, делать, например, summary за день.

    Также можно будет искать по аудио — и видеофайлам, которые просто были закинуты в саму программу.

    Ну, например, можно будет закинуть какой-то небольшой курс, и Claude будет по нему искать и подбирать информацию для тех или иных вещей.

    В некоторых направлениях, возможно, это будет не очень выгодно. Будет интереснее, наверное, использовать специализированные инструменты. Например, для кодирования лучше будет использовать MCP Tool Contex7...

    Но если это любая другая ниша, вероятно, это будет лучший вариант.

    + В ближайшем будущем будет поиск внутри документа, и это так же будет доступно по MCP
     
  9. 30 янв 2026
    #29
    skiftut
    skiftut ЧКЧлен клуба
    Приветствую @ProPractic. Недавно собрал себе нечто подобное только из халявного Whisper Key и скрипта Autohotkey батником стартует все и также останавливается Так же два варианта с LM studio или без по одной клавише пишет в форму, по другой и пишет и отправляет. Ну я так скажу, я печатаю быстрей. Ну и по сравнению с Aqua Voice по скорости небо земля. Сильно медленней работает чем Aqua Voice. Как в вашей программе со скоростью обработки голоса в текст? Не могли бы вы записать видео с демонстрацией как быстро работает программа.
    PS На всякий укажу машинку на чем тестировал, legion 5 pro c 32 оперативки и 8 видеопамяти.
     
    Последнее редактирование: 30 янв 2026
    2 пользователям это понравилось.
  10. 30 янв 2026
    #30
    ProPractic
    ProPractic ОргОрганизатор (А)
    Добрый день! Это действительно хороший вариант сборки.

    Про печать, возможно, это больше маркетинг, но мне бывает действительно иногда лень печатать. Или хочется ответить голосом, потому что во время лекций очень много говорю и уже привык к этому.

    Если говорить про скорость работы, то это примерно час аудио обрабатывается около двух минут на моей видеокарте. Я пробовал на другой машине, где стоит видеокарта 3050 с четырьмя, гигабайтами видеопамяти. Скорость обработки такая же, очень большая!

    Обработка диктофонных записей, вот вроде этой, что вы сейчас читаете, занимает секунды. А если говорить про процессор, то тут, конечно, всё будет очень сильно зависеть от мощности.

    Допустим, на стареньком ноутбуке жены, Core i5 восьмого поколения, четыре ядра, восемь потоков, одна минута аудио обрабатывается примерно 40 секунд. На своём процессоре я пока что не пробовал, но хочу попробовать. Но здесь, конечно же, не стоит ждать какой-то фантастики. Думаю что лучшее железо по CPU даст не больше чем x5 от продолжительности аудио (1минута за 12 секунд). В первую очередь, расчёт именно на видеокарту.

    Если будет запрос, я смогу подключить облачный Whisper, но, конечно же, за это тогда придётся платить по API. Так же, по запросу, можно будет сделать выбор модели. Чтобы даже на слабых машинах можно было получить 1минута за 5 секунд например...
     
    3 пользователям это понравилось.
  11. 30 янв 2026
    #31
    m0hi4y
    m0hi4y ЧКЧлен клуба
    Обычно Скрытая ссылка
    Но последнее время не всегда получается.
    На днях узнал про Stacher io
    Но еще не проверял.
     
    1 человеку нравится это.
  12. 30 янв 2026
    #32
    ProPractic
    ProPractic ОргОрганизатор (А)
    Ответил в ЛС
     
  13. 30 янв 2026
    #33
    ProPractic
    ProPractic ОргОрганизатор (А)
    @m0hi4y Видео уже в папочке с примерами :)
    Создал отдельную папку YOUTUBE TEST (ссылка в посте ниже)
     
    2 пользователям это понравилось.
  14. 30 янв 2026
    #34
    skiftut
    skiftut ЧКЧлен клуба
    @ProPractic. По поводу выкачивания с ютуба программа Internet Download Manager есть минус, платная (но когда нас это останавливало, у нас же есть импортозамещение, в виде ru-board) если лениво настраивать прокси в браузере или запускать (запрещенное слово из трех букАв), заходим в Яндекс браузере в поиск видео и ищем нужное видео там в этом варианте срабатывает качалка в 90% случаев.
     
    3 пользователям это понравилось.
  15. 30 янв 2026
    #35
    ProPractic
    ProPractic ОргОрганизатор (А)
    Благодарю, я года два назад писал скрипт под это дело, но, эти библиотеки так быстро устаревают, что, наверное, сейчас бы пришлось искать новые варианты и все переписывать. Google не любит когда не платят за YouTube API :)
     
  16. 31 янв 2026
    #36
    Cubinec
    Cubinec ЧКЧлен клуба
    возможно, чтобы обработанные данные с видео как то систематизировались в формате для Обсидиан? Тем более, что вы профи в нем. )
     
    2 пользователям это понравилось.
  17. 31 янв 2026
    #37
    ProPractic
    ProPractic ОргОрганизатор (А)
    Добрый день. Да, это можно будет сделать без проблем.
    Я думаю, что достаточно будет хорошего промпта, где мы попросим модель постобработки сделать заголовки, подзаголовки, а также оформление Markdown Style для Obsidian.

    Единственное, что вероятно потребуется умная модель, то есть либо мощное железо, либо уже OpenRouter.
     
    2 пользователям это понравилось.
  18. 31 янв 2026
    #38
    Xxxvita
    Xxxvita ЧКЧлен клуба
    У меня Linux Manjaro. Что на счёт этой ОС и вообще Linux?
    Как Ваша вариация использования Whisper Large ведёт себя со смешанной речью? Хотя бы rus + en.
     
    1 человеку нравится это.
  19. 31 янв 2026
    #39
    ProPractic
    ProPractic ОргОрганизатор (А)
    Программа готовится на всех операционных системах, но конкретно эта выдача будет на Windows. Позже, если будет интерес, я сделаю отдельные темы для macOS и Linux. И здесь я бы очень попросил написать тех, кому это будет актуально.

    По поводу смешанной речи — это достаточно расплывчатая история. Я бы хотел какие-то конкретные примеры, может быть, с того же YouTube. И тогда я, как и по прошлому запросу, мог бы сделать демонстративный тест.

    Если говорить про всякие слова, термины и англицизмы, технические термины — без проблем.
    Если 50 на 50, я не знаю, что получится, честно говоря, такие тесты я не проводил.
     
    1 человеку нравится это.
  20. 31 янв 2026
    #40
    Cubinec
    Cubinec ЧКЧлен клуба
    какого объема видео прога сможет обрабатывать? и какое железо посоветуете, будут рекомендации?
     
    1 человеку нравится это.
Статус обсуждения:
Комментирование ограничено.