Закрыто

[Windows] Whisper Voice Machine (голос → под курсор, видео → в конспект) [Lifetime] [ProPractic]

Тема в разделе "Бизнес и свое дело", создана пользователем ProPractic, 28 янв 2026.

Цена: 318 780р
Взнос: 4 600р
102%

Основной список: 75 участников

Резервный список: 1 участников

Статус обсуждения:
Комментирование ограничено.
  1. 28 янв 2026
    #1
    ProPractic
    ProPractic ОргОрганизатор (А)

    Складчина: [Windows] Whisper Voice Machine (голос → под курсор, видео → в конспект) [Lifetime] [ProPractic]

    Ваш Персональный Командный Центр с поддержкой MCP

    История о том, как я выбросил клавиатуру после 16 лет слепой печати и заставил AI работать на меня...

    upload_2026-1-28_12-29-30.jpeg

    :eek: У вас тоже есть эта папка? "Разобрать позже"?

    Давайте честно, мы находимся на Складчике, и все мы немного страдаем "синдромом хомяка". У каждого из нас на жестком диске лежат сотни гигабайт "мертвого груза", до которого просто не доходят руки. Это курсы, которые "надо глянуть на выходных", записи вебинаров по 3-4 часа и бесконечные аудио-лекции.

    Вы скачали их, потому что там есть ценность и вы за неё заплатили, но у вас физически нет времени смотреть 3 часа "воды", чтобы найти 5 минут "мяса". В итоге эти знания не работают на вас, они просто занимают место на диске и вызывают чувство вины за потраченные средства. Пора остановить этот бесконечный цикл отложенной жизни.

    А теперь представьте другую реальность.
    Вы берете папку с 10-часовым видео-курсом, перетаскиваете файлы в окно программы и спокойно идете заваривать чай. Whisper Voice Machine начинает "слушать" эти файлы в ускоренном режиме, пока вы отдыхаете. Возвращаетесь, а у вас перед глазами полный, структурированный текст, в котором вы мгновенно находите ответ на свой вопрос.

    Whisper Voice Machine (WVM)
    Ваш комбайн по переработке сырого контента и мыслей в структурированную базу знаний.

    :cool: Почему я перестал печатать (владея слепой печатью 16 лет)?

    Я разработчик, и мои пальцы бегают по клавиатуре быстрее, чем у 90% людей, чем я всегда гордился. Но 3 месяца назад я понял страшную правду: печать - это главное "узкое горлышко" моей продуктивности. Я думаю быстрее, чем печатаю, и пока я формулирую мысль, правлю опечатки и тянусь к Backspace - идея ускользает или мутирует.

    Я написал WVM, чтобы убрать этого неуклюжего посредника (клавиатуру) между моим мозгом и компьютером навсегда. Теперь я просто нажимаю кнопку на мыши, откидываюсь в кресле, закрываю глаза и говорю все, что приходит в голову. Программа не просто записывает звук, она думает за меня, превращая поток сознания в готовый документ.

    :) Три режима использования
    Узнайте себя в одном из них
    1. Для "Коллекционеров Знаний" (Складчиков)
      Перестаньте копить гигабайты, начните их монетизировать и применять здесь и сейчас.
      Сценарий: У вас есть запись зум-созвона, купленный курс или длинная лекция на английском.
      Магия: Закиньте файл в WVM (Drag & Drop). Через несколько минут у вас есть текстовая расшифровка и перевод.
      Результат: Попросите AI сделать саммари: "Выдели главные инсайты и составь список задач". Вы "посмотрели" 2-часовое видео за 5 минут чтения.
    2. Для SMM, Копирайтеров и Креаторов
      Вам знакомо чувство "чистого листа", когда курсор мигает, а в голове звенящая пустота?
      Решение: Пойдите гулять с собакой или мыть посуду, надиктовывая поток идей, обрывки фраз и шутки в телефон.
      Обработка: Пришли, закинули аудио в WVM и применили промт "Сделай пост в стиле Ильяхова".
      Итог: Черновик готов, вам остается только опубликовать, превращаясь в настоящую фабрику контента.
    3. Для Управленцев и Менеджеров
      Вас бесят бесконечные переписки, но вы обязаны соблюдать корпоративный этикет?
      Действие: Нажмите хоткей и выплесните эмоции: "Скажи этому <цензура>, что он сорвал все сроки, и мы расторгаем договор!".
      Результат: В чат вставляется идеально выверенное, холодное и юридически грамотное письмо. Ваша нервная система скажет вам спасибо, а репутация останется безупречной.
    :cool: Ваш технологический арсенал

    1. Тотальный отказ от ручной печати
    Диктуйте везде: Word, Telegram, Браузер, IDE, Notion. Где мигает курсор - туда летит идеальный текст. Вы сами пишете промты для обработки, создавая свой уникальный стиль.

    2. "Пожиратель Курсов": Видео в Текст + Перевод
    Купили крутой курс на английском, но уровень языка не позволяет смотреть в оригинале? Закиньте видео в WVM с промтом "Переведи на русский и оформи как конспект". Вы получите готовую методичку на родном языке.

    3. Model Content Protocol (MCP Server)
    Технология будущего, доступная сегодня.
    WVM выступает сервером для ваших AI-агентов (Claude Desktop, IDE агенты).
    Вы можете попросить Claude Desktop (или иную программу): "Проанализируй мои записи за прошлую неделю и найди идеи для стартапа". Агент сам залезет в вашу локальную базу, найдет нужное и даже откроет документ перед вами. Сделать саммари "сегодняшних заметок" или поискать "то самое видео про X и открыть его в программе."

    4. Умный поиск и База Знаний
    Все ваши мысли сохраняются локально. Мгновенный полнотекстовый поиск по архиву, фильтрация по датам. Ни одна гениальная мысль больше не потеряется.

    1.png
    Окно поиска: Ваша база знаний всегда под рукой

    2.png

    Настройки AI: Полная свобода в выборе моделей и промтов​

    Я уважаю ваше железо и кошелек, поэтому говорю как есть — без маркетингового обмана.

    1) Распознавание (Уши) — 100% локально
    Локально через ядро Whisper. Ваши файлы и голос никогда не уходят на чужие сервера. Абсолютная приватность.

    Базовый вариант (без постобработки):
    Вы можете выключить постобработку и работать почти что на любом современном компьютере.
    Нужно примерно 8 ГБ ОЗУ и нормальный современный процессор. Начиная от Intel 8-го поколения — вообще комфортно. Но у меня это работает даже на Intel 4-го поколения.
    Это самый доступный режим.

    2) Постобработка (Мозги) — на ваш выбор
    • Вариант №2 — облачная постобработка (максимум качества на слабом ПК)
      Если вы хотите постобработку, но у вас слабая машина — подключаете облачную LLM и получаете суперкачественную, супербыструю постобработку.
      Пример: OpenRouter (Gemini Flash, DeepSeek и др.).
      Экономика: обработка огромного лонгрида стоит пару центов, а вашей диктофонной записи — десятой цента.
    • Вариант №3 — локальная постобработка (тотальная приватность)
      Если вы хотите постобработку локально и без облака — вам потребуется мощное железо.
      Минимум: видеокарта от 8 ГБ VRAM — это режим для самых простых моделей постобработки.
      Рекомендуется: 16 ГБ VRAM, если хотите действительно качественную постобработку и комфорт.
      Из современных относительно недорогих вариантов — условная xx60 Ti на 16 ГБ.

      Из протестированных мной моделей отлично себя показывают:
      Qwen 3 (4B и 8B), Gemma 3 (разные размеры).
      Но если вы хотите очень качественную постобработку — лучше ориентироваться на 16 ГБ VRAM в локальном режиме.
      Я сам чаще использую облачную постобработку (через OpenRouter), потому что у меня нет суперконфиденциальных данных.
      Но если бы я был юристом или психотерапевтом — я бы использовал исключительно локальные варианты.
    Системные требования (3 уровня)

    1) Минимальные (базовый режим: только распознавание)
    Для кого: если вам нужна расшифровка аудио/видео в текст, без постобработки LLM (без «улучшайзинга», саммари, задач и т.д.).
    • CPU: Intel Core от 4-го поколения (у меня работает на таком железе).
    • ОЗУ: 8 ГБ.
    • GPU: не обязателен (можно на CPU, просто будет медленнее).
    Что вы получаете: абсолютную приватность и максимальную совместимость — подходит почти для любого «живого» ПК.

    2) Комфортный (распознавание быстро и стабильно + облачная постобработка)
    Для кого: если вы хотите «красивый» текст (саммари, инсайты, задачи, стиль письма), но ваш компьютер не тянет локальные LLM — вы подключаете облако (OpenRouter и т.п.).
    • CPU: Intel Core от 8-го поколения (или аналогичный современный Ryzen).
    • ОЗУ: 16 ГБ (можно 8 ГБ, но 16 — заметно спокойнее).
    • GPU: желательно Nvidia от 4 ГБ (например GTX 1050 Ti), чтобы распознавание шло комфортно. (Можно и без GPU, но медленнее.)
    • Интернет: нужен только для постобработки (распознавание всё равно локальное).
    Что вы получаете: быстрый локальный Whisper + сверхкачественную постобработку «в облаке» за копейки.

    3) Максимальный (тотальная автономность: распознавание + локальная постобработка)
    Для кого: если вам нужна постобработка LLM строго локально (максимальная приватность) и вы хотите скорость/качество без облака.
    • ОЗУ: 32 ГБ (минимум 16 ГБ, но 32 — правильная база под локальные LLM).
    • GPU: Nvidia RTX с 16 ГБ VRAM — рекомендуется для качественной локальной постобработки (8 ГБ VRAM — минимум для самых простых моделей, но качество/комфорт ниже).
    • CPU: современный многоядерный (чем мощнее — тем лучше), но основной упор тут в GPU/VRAM.
    Что вы получаете: полный «локальный комбайн» — и распознавание, и постобработка на вашей машине, без передачи текста/данных в облако. На моём Ryzen 7 5700x + 32bg ram + 3080 10gb vram простые локальные модели вполне неплохо крутятся.

    :cool: Почему lifetimeI, а не подписка?

    Я разработчик-одиночка, который пользуется своим продуктом каждый день. Западные аналоги (SuperWhisper, Otter) просят $15-20 в месяц вечно. Здесь, эксклюзивно на Складчике, вы получаете:
    • Пожизненную лицензию (Lifetime) на 3 ваших компьютера.
    • Пакет «Системных промтов» (SMM, деловой стиль, кодинг).
    • Прямую поддержку от автора в этой теме.
    • Гарантию безопасности: программа логирует только технические ошибки. Никаких личных данных, текстов или ключей никуда не отправляется.
    Важно по-честному про обновления и поддержку:
    Обновления — 3 месяца, поддержка — 6 месяцев (в рамках этой версии).
    Я буду слушать пожелания, допиливать программу и собирать обратную связь — я готовлю продукт к релизу на международном рынке, и мне важно обкатать всё на живых сценариях.
    На международном рынке она, вероятно, будет стоить дороже.
    Код будет защищен через обфускацию. Привязка к железу.
    Вы получаете установщик, который установит софт на ваш компьютер (всё по взрослому))


    Хватит печатать и копить информацию. Начните управлять ею.

    :D Специальный бонус за рекламу
    Сделайте 3 рекламных поста и получите расширенный пакет "Golden Pack" промтов​

    Внутри бонуса набор:

    "Telegram-Машина" — посты из бубнежа.
    "Корректор" — исправление ошибок с сохранением стиля.
    "Деловая Акула" — жесткие юридические письма.
    "Кодер" — оформление алгоритмов в чистый код.

    Записывайтесь. В повторе, цена будет выше. А на обновления мажорных версий вас будет ждать скидка.

    Все экраны приложения.

    upload_2026-1-28_12-29-30.jpeg 2026-01-27_22-58-35.jpg 2026-01-27_22-59-16.jpg 2026-01-27_22-59-37.jpg 2026-01-27_22-59-46.jpg 2026-01-27_23-00-00.jpg 2026-01-27_23-00-08.jpg 2026-01-27_23-00-19.jpg 2026-01-27_23-00-27.jpg 2026-01-27_23-00-35.jpg
     
    Последнее редактирование модератором: 7 фев 2026
    8 пользователям это понравилось.
  2. Последние события

    1. Рома У
      Рома У оставил отзыв "Отлично".
      30 апр 2026 в 11:04
    2. fetmarshal
      fetmarshal оставил отзыв "Отлично".
      30 мар 2026
    3. kuler
      kuler оставил отзыв "Отлично".
      30 мар 2026
    4. Oksana_2015
      Oksana_2015 оставил отзыв "Отлично".
      29 мар 2026

    Последние важные события

    1. skladchik.com
      Складчина закрыта.
      18 мар 2026
    2. skladchik.com
      Складчина доступна.
      17 мар 2026
    3. skladchik.com
      Складчина закрыта.
      15 мар 2026
    4. skladchik.com
      Складчина доступна.
      23 фев 2026
  3. Отзывы участников

    5/5,
    • 5/5,
      5 звезд ставлю от души!
      Софтом пользуюсь каждый день, реально экономит время. Рад приобретению. Одна из немногих удачных покупок на складчике.
      Хочу пожелать автору развития и такой же качественной поддержки продукта и создания новых софтов!
      30 апр 2026 в 11:04
      3 пользователям это понравилось.
    • 5/5,
      Программа реально хорошая и полезная. Отлично помогает с транскрипцией, голосовым вводом и разбором курсов и записей, экономит кучу времени. Время —- бесценный ресурс, и эта программа помогает его заметно беречь.
      Отдельно радует, что автор постоянно на связи, быстро исправляет баги, дорабатывает функционал и не бросает продукт после запуска. Пользуюсь с удовольствием и покупкой доволен.
      30 мар 2026
      3 пользователям это понравилось.
    • 5/5,
      Здравствуйте, коллеги. Великолепная программа для обработки видео и аудио в текст. Я ранее баловался с моделью Whisper, скачивая ее локально на комп, написав код в Пайтоне. Хорошо распознается текст, вполне читаем. Здесь же автор сделал достаточно полезный продукт. Очень экономит время, а то курсов вагон, надо разгребать лопатой.

      1. Есть начитка под курсор, где бы то ни было текстовый файл, ворд и другие. Избавляет иной раз от печатания на клаве, хотя владею "слепым методом".
      2. Постобработка файлов. После сырой обработки текст преобразуется через промт в нужную структуру, например для телеграм или перевод на другой язык.
      3. Обработка файлов разными способами: как локальной моделью, так и облачной. В моем случае железо слабое, поэтому постобработку лучше делать через облачную модель. Для локальных моделей лучше мощную видюху, тогда полет будет нормальным. А так вполне читаемый текст, если даже без постобработки.
      И многое другое.

      Автор постоянно исправляет баги и дорабатывает программу, обновляет. Подходит к каждому у кого не получается что то сделать. Мы как ранние тестировщики, можно так сказать, помогали тоже, отправляя логи и таким образом выявляли ошибки. На текущий момент сделано очень многое, а в планах х ProPractic еще есть мысли, мега мозг). Спасибо за ценность продукта и кучу сэкономленного времени. А главные ресурсы сегодня это наше внимание и время.
      Я доволен приобретением продукта и использую по сути его каждый день. Желаю счастья, здоровья автору и всем складчикам. Бодрости, энергии жизни и всего лучшего.
      30 мар 2026
      4 пользователям это понравилось.
    • 5/5,
      Я очень криворукая в плане установки программ. Я просто БЛАГОДАРЮ, искрене, я что только не пробовала из программ транскрабации - вот не шло и все. Здесь все установилось (да с 4 раза, я криворукая, но установилось). Программа просто суппер, залил, включил -вот текст. Спасибо огромнейшее!!!!!!!!!!!!!!
      29 мар 2026
      4 пользователям это понравилось.
    • 5/5,
      Программа просто вышка и спасибо за это нашему мужчинскому ProPractic, теперь: Я буду писать любой текст не притрагивайся к клаве, буду классно изучать курсы и просто дико кайфовать от жизни. Я в 100 раз МИНИМУМ приумножу вложенные в эту программу бабки, все из-за чудесного функционала. И будем честны ProPractic бомбовый чувак, который делает классный продукт и всегда придет на помощь с обратной связью. Спасибо за сие творение!
      26 мар 2026
      9 пользователям это понравилось.
    • 5/5,
      Не могу не согласиться с отзывами коллег, программа досталась можно сказать за спасибо, учитывая функционал, который ко всему же дорабатывается по ходу пьесы, это просто подарок. Спасибо Автору за хорошую идею, немецкую педантичность и прямые руки. Подписался, буду ждать новых продуктов.
      24 мар 2026
      8 пользователям это понравилось.
    • 5/5,
      Софтина работает отлично. Просто восторг! Однозначно всем рекомендую. Пошёл сдувать пыль с залежей купленных на складчике курсов. :)
      24 мар 2026
      7 пользователям это понравилось.
    • 5/5,
      Программа отличная. До начала складчины я спрашивал у автора про арабский и казахские языки, он ответил, что с казахским языком модель Whisper категорически не дружит, как и с китайским. Хотя я редко пользуюсь для распознавания этих языков, работаю в основном на русском, но вчера решил потестить и на мое удивление модель large-v3 отлично распознал казахский язык в кириллице как положено. Арабский - не смог, выдал в латинице. С микрофона выдавал перевод на русский, немного подправил промпт и с микрофона тоже начал отлично распознавать казахский. Я доволен и рекомендую к покупке. Автор наверное не спал все эти дни, по полной обслуживал складчиков.
      Это я только 5-10% функций программы использовал, чуть-чуть подкручивал промты автора. Если внедрить туда своих промтов, разобраться с MCP, я затрудняюсь сказать что будет.
      20 мар 2026
      8 пользователям это понравилось.
    • 5/5,
      Отличная программка! Врятли я познала и оценила уже все ее возможности. Но это супер! У меня простенький комп, и нет отдельной видеокарты, но все работает, транскрибирует, и экономит кучу времени. Высочайший уровень отзывчивости и компетентности Автора! Впечатлена! Рекомендую!
      17 мар 2026
      6 пользователям это понравилось.
    • 5/5,
      Программа вывела мою работу с информацией на новый уровень. Удалось эффективно организовать свои личные аудиозаписи, преобразовывать их в качественные заметки в Obsidian. Голосовой ввод под курсор прижился сразу, это невероятно удобно. Курсы со складчика начали давать более весомые результаты. И всё это используя ресурсы только своего ПК (Ryzen 5 + RTX 5060ti + LM Studio). Облачная постобработка выручает на рабочем ноутбуке. И конечно же очень радует постоянное развитие программы.
      16 мар 2026
      7 пользователям это понравилось.
    • 5/5,
      Мои терабайты неотсмотренных курсов наконец-то начали приносить пользу. Просто закинул 10-часовой курс в WVM и через 20 минут получил готовый конспект с инсайтами. Чувство вины за потраченные на складчике деньги исчезло.
      Большой плюс - приватность: всё распознаётся локально на моём компе. Не нужно ежемесячно платить за транскрибацию сторонним сервисам.
      Программой остался доволен.
      16 мар 2026
      12 пользователям это понравилось.
    • 5/5,
      Обжегшись на нескольких авторских складчинах здесь я очень доволен вовлеченностью автора, которому удалось сделать качественный продукт, за который не жалко ни рубля, особо радует бессрочная лицензия и его отзывчивость, вместе заборем любые баги если на кону стоит качество, а не деньги
      14 мар 2026
      8 пользователям это понравилось.
    • 5/5,
      Отличное приложение все как заявлено! Теперь начинаю разгребать свой бардак с файлами и курсами. Респект автору за разработку такой полезной проги
      6 мар 2026
      8 пользователям это понравилось.
    • 5/5,
      Заявленный функционал полностью соответствут реальной программе. Автор оперативно правит баги, добавляет новый функционал по желанию пользователей, открыт к общению. Брал программу, в первую очередь для голосового ввода текста, отрабатывает на 100%. Также отлично работает транскрибация аудио, можно использовать всю мощь LLM для допиливания текста, очень удобно.
      5 мар 2026
      11 пользователям это понравилось.
    • 5/5,
      Любите читать, а не слушать? Эта программа — стала моим спасением!
      Наконец-то можно пропускать видеолекции, не теряя сути. Прогоняю курсы через софт, а он синхронизирует тайминги с текстом.
      Нужно посмотреть картинку или схему? Нырнул к нужной секунде, посмотрел, вернулся к чтению. Идеально для тех, кто впитывает инфу через глаза.
      Первые баги быстро исправили с апдейтами. Сейчас — полный восторг. Пробовал и локально LLM и через OpenRouter.
      OpenRouter пока побеждает.Обработка там ощутимо быстрее, даже несмотря на мою 16-гиговую видюху.
      Автор всегда на связи. Чинит баги, допиливает софт, добавляет плюшки и функционал.
      И да, отзыв написан конечно же через Whisper Voice Machine. Сам расставляет теги, смайлики и всё остальное для «Складчика» с использованием промпта от @ProPractic.
      5 мар 2026
      12 пользователям это понравилось.
    • 5/5,
      Брал для голосового ввода на ноутбуке Ryzen 5 + RTX 3050. По инструкции всё установилось сразу, всё работает стационарно: приложение в трее, включается горячей клавишей. На 80% заменило клавиатуру.
      До этого пробовал разные варианты, и, по моему мнению, на данный момент это лучшее решение.
      За пару дней использования уже не представляю, как обходился без него — к хорошему привыкаешь быстро
      5 мар 2026
      8 пользователям это понравилось.
    • 5/5,
      Программа отлично работает. Брала для транскрибации видео в текст + иногда запись голосом, хорошо все отрабатывает на компьютере с оперативной памятью 16 гигов и процессором AMD. Ставлю очередь и занимаюсь своими делами (за пару дней в фоне трансгрибировала часов 10, можно и больше, но я не часто подходила к компьютеру). Да, не быстро на таком железе, но автор предлагает решения которые могут увеличить скорость. Понравилась поддержка и оперативные доработки полезных функций.
      5 мар 2026
      11 пользователям это понравилось.
    • 5/5,
      Всем привет! Хочу оставить отзыв о данной программке, которая помогает мне именно с голосовым вводом под курсор. В принципе, только для этого я ее и приобретал, как хорошую говорилку. Но пока что сейчас я понимаю, что я использую всего лишь 5 или 10% всего лишь всего функционала, но мне этого в принципе достаточно. Я не планировал делать транскрибации видео в конспект, может быть в дальнейшем как-то это распробую. Но сейчас я хочу выразить огромную благодарность автору за столь проделанный труд. Хочу сказать, что поддержка на высоте автор старается усовершенствовать свое приложение и постоянно дополняет, расширяет даже функционал, какие-то фишки допиливает. Это приятно видеть, слышать и понимать, потому что для меня это, важно, когда не просто софт отдали и пользуйтесь, пожалуйста, все готово, а именно прислушиваются и чуть ли не к каждому. Индивидуальный подход и, каждому внимание. Сейчас даже отзыв я этот записываю с помощью этой программы, ничего лишнего не подключал, просто как она есть, бесплатно, без всего, просто даже особо не разбирался. Для меня была сейчас важна именно говорилка и достаточно качественную из условно бесплатных я не находил. Сейчас такой формат меня полностью устраивает, я, конечно, попозже чуть-чуть разберусь, более поглубже в этой программке, и я уверен, что она будет еще допиливаться и будет еще много что впереди интересного. Так что от чистого сердца рекомендую, кому нужен такой функционал, он не пожалеет.
      4 мар 2026
      13 пользователям это понравилось.
    • 5/5,
      Офигеть как я довольна. Не нужно платить сервисам-транскрибаторам - теперь свой собственный транскрибатор на компе. Не нужно переживать, хватит ли лимита в складчине-транскрибаторе , когда нужен транскрибатор. Сегодня столкнулась с текущей задачей, нужно было найти определенный момент в часовом видео. Пересматривать - долго. Загрузила видео в приложение , транскрибировала за 1-2 минуты и через поиск нашла нужный фрагмент. Идеально. Спасибо большое автору! Особое спасибо за поддержку во время установки софта.
      1 мар 2026
      17 пользователям это понравилось.
  4. Обсуждение
  5. 28 янв 2026
    #2
    ProPractic
    ProPractic ОргОрганизатор (А)
    Софт уже полностью написан, упакован в .exe и создан установщик для Windows.

    Сейчас происходит адаптация под macOS, также есть полностью функциональная версия. Если будут желающие, я обязательно сделаю отдельную тему под macOS.

    Лицензия будет выдана на три машины с привязкой к вашему железу. Большие и крупные обновления в будущем будут происходить для участников уже со скидкой.

    И здесь также я еще сделаю серию постов про возможности программы и с радостью отвечу на все ваши вопросы.

    Будет вкусный бонус за отзыв.

    Кстати, этот текст тоже был только что надиктован. И оформлен этой программой.
     
    6 пользователям это понравилось.
  6. 28 янв 2026
    #3
    Рома У
    Рома У ЧКЧлен клуба
    Подскажите, можно ли делать такое саммари курса, чтобы не было проблем с авторскими правами. Чтобы он отличался от оригинала и его можно было как-то распространять без риск

    И еще вопрос "Возвращаетесь, а у вас перед глазами полный, структурированный текст, в котором вы мгновенно находите ответ на свой вопрос." Полный текст это слово в слово как в оригинале или софт делает уже сам структуру убирая лишнее: слова паразиты и тд
     
    Последнее редактирование: 28 янв 2026
    2 пользователям это понравилось.
  7. 28 янв 2026
    #4
    ProPractic
    ProPractic ОргОрганизатор (А)
    При этом я хочу обратить внимание на то, что вам всегда будет доступна возможность посмотреть оригинальный исходник и обработать его повторно другим промптом.

    То есть, часть, где ваш голос распознается в текст, она неизменяема, а вторым слоем идет часть постобработки. Таким образом, мы собираем небольшой слоеный пирог из информации.
    upload_2026-1-28_17-25-41.png
    upload_2026-1-28_17-26-18.png
     
    3 пользователям это понравилось.
  8. 28 янв 2026
    #5
    ProPractic
    ProPractic ОргОрганизатор (А)
    Подготовил демонстрационное видео: вы можете посмотреть, как работает программа.

    Также это видео было потом обработано в ней, и вы сможете оценить качество постобработки локальной модели Gemma 3 (4 миллиарда параметров), а также облачной моделью OpenRouter - Gemini Flash 3.

    И третий файл вообще никакой постобработки, просто то, что вы получаете из программы: с разбивкой на абзацы и с тайм-кодами.



    Если есть такая возможность, попрошу модераторов ссылочку закрепить в стартовом посте :rolleyes:
     
    6 пользователям это понравилось.
  9. 28 янв 2026
    #6
    m0hi4y
    m0hi4y ЧКЧлен клуба
    С помощью программы можно переводить с любых языков?
    Видео/аудио любой длительности возможно отдавать программе? И как много времени занимает перевод например видео длительностью 1 час?
    Насколько близки и адекватны итоговые переводы к оригиналу? Ведь часто нейронки наглючивают то, чего и не было в контенте.
     
    1 человеку нравится это.
  10. 29 янв 2026
    #7
    ProPractic
    ProPractic ОргОрганизатор (А)
    @m0hi4y, спасибо за вопрос :)

    Буду честен, это не лекарство от всех болезней. Распознавание аудио сильно зависит от языка, от качества записи, от произношения диктора, от наличия шумов.

    Ниже я предлагаю табличку, где вы можете посмотреть, какие языки могут плохо распознаться. Соответственно, если они плохо распознаются, какая бы классная модель постобработки ни была, даже облачная, вероятно, с ней будут проблемы. Хорошая новость в том, что модель распознавания обучалась примерно на 100 языках. И европейская группа языков, славянская группа языков, большинство азиатских языков будут хорошо распознаваться.

    Распознавание: Гарантированно проблемы могут быть с китайским языком и тюркской группой, наверное (если так можно сказать): казахский, узбекский, таджикский.

    Вы, в принципе, можете посмотреть табличку. Если вам нужно распознавать эти языки, чтобы потом их на что-то переводить, возможно, программа для вас не очень актуальна.

    upload_2026-1-29_11-13-38.png

    Допустим, сейчас у меня рядом ездит робот-пылесос, и вроде бы распознавание происходит неплохо. (Вы читаете этот текст)

    Если говорить про перевод, это уже касается второго этапа обработки. Этим занимается модель, которая делает пост-обработку.

    Это будет означать то, что качество перевода будет зависеть от того, какая модель у вас будет этим заниматься. И здесь, наверное, я бы не стал полагаться на локальные модели. Конечно же, если вы не обладатель очень мощного железа, я доверился бы качественным моделям, которые доступны по облаку. И вот они, я уверен, что сделают очень достойный перевод того, что распознает локальная модель.
     
    Последнее редактирование: 29 янв 2026
    2 пользователям это понравилось.
  11. 29 янв 2026
    #8
    ProPractic
    ProPractic ОргОрганизатор (А)
    Если вы дадите конкретные задачи, я могу прогнать тесты, и мы посмотрим на результат.
    Может быть, видео с YouTube и целевой язык
     
    1 человеку нравится это.
  12. 29 янв 2026
    #9
    Kaliostro666
    Kaliostro666 ЧКЧлен клуба
    @ProPractic, добрый день!
    Подскажите, а делает ли Ваша программа конспекты с видео, защищенных инфопротектором?)
     
    2 пользователям это понравилось.
  13. 29 янв 2026
    #10
    ProPractic
    ProPractic ОргОрганизатор (А)
    Добрый день!

    Честно сказать я не помню как выглядит файл инфопротектора

    Если это обычный видеофайл то без проблем. Программа извлекает аудио дорожку с помощью ffmpeg

    Обработки видеоряда пока нет...

    Ну если я не ошибаюсь там всё гораздо сложнее (
     
    1 человеку нравится это.
  14. 29 янв 2026
    #11
    Kaliostro666
    Kaliostro666 ЧКЧлен клуба
    Ну да) Там видео в формате *.ipr ))
     
    1 человеку нравится это.
  15. 29 янв 2026
    #12
    ProPractic
    ProPractic ОргОрганизатор (А)


    К сожалению это немножко другого профиля софт
     
    1 человеку нравится это.
  16. 29 янв 2026
    #13
    m0hi4y
    m0hi4y ЧКЧлен клуба
    Например:


     
    1 человеку нравится это.
  17. 29 янв 2026
    #14
    anderson10
    anderson10 ЧКЧлен клуба
    Там зашифрованный файл, поэтому для работы с ним нужно как-то извратиться, чтобы извлечь звук. Можно звук записать во время проигрывания файла в плеере инфопротектора, например, на диктофон. И распознавать/транскрибировать уже диктофонную запись, представленную в виде привычного мультимедийного файла. С файлами инфопротектора может работать только сам инфопротектор. Иначе какой смысл шифровать файл так, чтобы его можно было расшифровать без проблем? :) А в инфопротекторе файл зашифрован по самое "не балуй" :(
     
    3 пользователям это понравилось.
  18. 29 янв 2026
    #15
    Holdi
    Holdi ЧКЧлен клуба
    А приложение на телефон можно будет сделать или может наработки какие есть? Или технически это можно реализовать только на компе?
     
    1 человеку нравится это.
  19. 29 янв 2026
    #16
    ProPractic
    ProPractic ОргОрганизатор (А)
    Технически это возможно. Ну, допустим, у Super Whisper есть приложение под iOS. Есть легковесные модели, которые могут делать распознавание голоса менее качественно, чем Whisper, но если хочется серьезной постобработки, то конечно же это только десктопная версия.

    У меня была мысль сделать как примочкуTelegram-бота, чтобы при включенном компьютере можно было отправлять аудиосообщения или другие медиа туда, загружать и получать, может быть, в ответ даже распознавание. Но пока что я отказался от этой идеи.
     
    3 пользователям это понравилось.
  20. 29 янв 2026
    #17
    Holdi
    Holdi ЧКЧлен клуба
    по моему было бы неплохо облегченную версию на андройде иметь))) С возможностью синхронизироваться с десктопной версией или что то подобное)
     
    1 человеку нравится это.
  21. 29 янв 2026
    #18
    ProPractic
    ProPractic ОргОрганизатор (А)
    Честно скажу, глядя на то, как раскаляет мой MacBook на чипе M3 на 8 гигабайт памяти, а также видеокарту 3080 на 10 гигабайт видеопамяти, эти модели, мне кажется, что то, что сейчас работает на мобильных устройствах, является детской игрушкой.

    Единственное, в чем я лично вижу смысл — это возможность отправки заданий на локальную машину, ну или какую-то синхронизацию истории, чтобы можно было работать с информацией на Android.

    Вот как раз для этого я думал делать с Telegram-ботом: куда можно просто отправлять аудиофайлы, видеофайлы, пересылать аудиосообщения от кого-либо и чтобы все это сохранялось локально в собственной базе данных.

    По итогу, возможно, с отправкой в ответ расшифрованных текстов также в Telegram. Плюс тут открывается какая-то опция с совместной работой, то есть можно дать доступ еще нескольким людям для работы с конкретной базой данных.
     
    4 пользователям это понравилось.
  22. 29 янв 2026
    #19
    ProPractic
    ProPractic ОргОрганизатор (А)
    @m0hi4y А подскажите, чем сейчас видео выкачиваете с Ютуба - у меня было пару хороших плагинов но не один ни на одном видео не сработал...
     
  23. 30 янв 2026
    #20
    Hillman_T
    Hillman_T ЧКЧлен клуба
    Вопросом транскрибации интересуюсь тоже довольно давно - в результате пользуюсь PLAUD NOTE. Теперь буду сравнивать с
    Whisper Voice Machine
     
    2 пользователям это понравилось.
Статус обсуждения:
Комментирование ограничено.