Объединённое техническое задание SEOMA

Объединённое техническое задание SEOMA

Версия 0.8 — 8 июля 2025 г.
Рабочий период: 1 июля → 1 октября 2025 г. (три полных месяца)


1. Введение и цели

К 1 октября 2025 года планируется публичный релиз трёх ключевых продуктов экосистемы SEOMA.

  • SEOMA-Capsule-Live v 1.3 (GA) — трёхмерная Web-сцена с групповым голосом до 100 человек, донатами и двусторонним автопереводом речи RU ↔ EN.
  • Video-Avatar Studio (β-доступ авторам) — облачная студия, генерирующая 60-секундные видеоролики 1080p, поддерживающая Photo2Video Pro и персональные 3-D-аватары.
  • Mobile Suite 1.0 (iOS / Android) — одно мобильное приложение для мгновенного входа в Capsule-Live, донатов, покупки кредитов и создания AI-роликов с push-deep-links.

2. Периметр проекта и основные продукты

2.1 Capsule-Live v 1.3

  • Трёхмерная WebGL / WebGPU-сцена, стабильные 30 fps и выше.
  • Групповой пространственный голос на базе Photon Voice (до 100 участников) с автопереводом RU ↔ EN и субтитрами.
  • Донаты через Stripe Checkout (быстрые пресеты 1 / 5 / 10 USD).
  • Текстовая гостевая книга с REST-модерацией.
  • Целевой выпуск GA — 1 октября 2025 г.

2.2 Video-Avatar Studio β (включая Photo2Video Pro)

  • SPA + REST-API для генерации роликов 1080p / 25 fps длительностью 60 с.
  • Библиотека: десять базовых 3-D / 2-D персонажей, десять фоновых шаблонов, не менее двадцати голосов XTTS.
  • Персональный аватар создаётся из одной-трёх фотографий и доступен как в Studio, так и в Capsule-Live.
  • Photo2Video Pro: одно фото + текст → 15 / 30 / 60 с talking-head; пакетная обработка до десяти фото.
  • Монетизация через Stripe Credits (пакеты 50 / 200 / 500); типовой ролик — 10 кредитов, Photo2Video — 5.
  • Доступ по whitelist к 1 октября 2025 г.

2.3 Mobile Suite 1.0

  • Реализация на React Native 0.74 / Expo 51.
  • Deep-link вида capsule://{id} открывает нужную Capsule во встроенном WebView.
  • In-App Purchase для донатов (1 / 5 / 10 USD + кастомные суммы) и кредитных пакетов 50 / 200 / 500.
  • Вкладка “Studio” использует тот же REST-API, что и веб-версия.
  • Push-уведомления (FCM / APNS), Crashlytics, Sentry; локализация RU / EN / ES, светлая и тёмная темы.
  • Публичный релиз планируется до 1 октября 2025 г.

2.4 Стартовая библиотека сцен (шаблоны Capsule-мира)

  • 10 готовых локаций:
    гостиная • класс • галерея • малый клуб • парк 360° • чёрная студия • кафе-ко-воркинг • тропический пляж • кибер-лофт • мини-театр.
  • Доступны в мастере Create Capsule; у каждой сцены — преднастроенные Anchor-точки, свет, гостевая книга, донат-UI.
  • Ассеты Unity Asset Store, суммарная закупка ≤ 3 700 USD.
  • Сроки: покупка + юр-проверка до 18 июля, asset-freeze в S3 и подключение к мастеру до 20 августа.
  • Ограничения производительности: Bundle ≤ 45 MB, LCP ≤ 2,5 с (4 G), p50 fps ≥ 40 (desktop) / ≥ 30 (Pixel 7).

2.5 Commercial model

  • Для авторов вводится тариф Creator Annual 50 Gift. Лицензия стоит 49 € в год и сразу начисляет невозвратный подарочный кредит 50 USD, эквивалентный публикации 50 аватаров и 50 Capsule-сцен. В профиле пользователя появляются поля plan_tier, gift_balance, avatars_left, scenes_left.
  • Любой платеж внутри экосистемы «разрезается» автоматически: 75 % уходит автору, 25 % — SEOMA. Сплит выполняет Stripe Connect; выплаты перечисляются автору первого числа каждого месяца на счёт Qonto (параметр payout_schedule=»monthly»). Сводный отчёт за период приходит автору по webhook-ссылке monthly_report.pdf.

2.6 Pricing & Plans

В экосистеме действует три потребительских плана.

  • Free Preview: 0 USD, 1 аватар, 1 сцена, 15-секундное видео 720 p, watermark, авто-удаление через сутки.
  • Creator Monthly: 9 USD/мес, 5 аватаров, 5 сцен, хранение 30 дней, без переноса остатков.
  • Creator Annual 50 Gift (launch-price до 31.12.2025): 49 USD/год, сразу дарит кредит 50 USD, 50 аватаров, 50 сцен, хранение 365 дней, при продлении кредит возобновляется.

Покупка бустеров возможна только при активном плане.

purchase_booster_requires_plan: true  // Бустеры продаются только при активном Monthly или Annual плане

Партия промо-купов launch2025Q3 (5 000 шт.) обнуляет стоимость годового плана до 31 октября 2025 г.

Единственные платёжные провайдеры — Stripe, Apple IAP, Google Play Billing; revenue-split 75 / 25, ежемесячная выплата через Stripe Connect, окно возврата средств 14 дней, если лимиты не израсходованы.

УровеньЦенаЧто даёмЗачем нужно
Free Preview0 USD1 аватар (15 сек, 720p, watermark); 1 черновик Capsule-сцены (приватно, ≤24 ч, watermark); просмотр чужих Capsule, участие в Live-турах, донатыСнять барьер «пощупать руками»; собрать email/соц-логин; вызвать желание «без ватермарка и подольше»
Creator Monthly9 USD / мес5 аватаров + 5 сцен; доступ к маркетплейсу; 25 GB хранения 30 днейНизкий порог входа, измерение churn / LTV
Creator Annual 50 Gift (launch)49 USD / год + 50 USD кредит (50 аватаров + 50 сцен)100 GB хранения 1 год; доступ к Exact Likeness; badge “Early Creator ’25”Максимальный LTV сразу при «магически низкой» цене



2.7 Realism Preset.

По умолчанию весь визуальный/аудиоконтент рендерится в режиме ≤ 95 % realism: алгоритм вносит лёгкий шум, цветовой дрейф до ±3 % и ограничивает резкость. Опция Exact Likeness ≈ 100 % разблокируется только после того, как пользователь ставит галочку «I own (or have model-release for) this likeness». При таком выборе итоговый файл получает визуальный ярлык AI-modified. Значение пресета передаётся полем realism_preset ( «95» | «100» ) во все вызовы XTTS, SDXL и Face-Swap; метрика avatar_realism_total фиксирует распределение по пресетам.


3. Capsule-Live v 1.3 — детальные требования

  1. Архитектура: SPA (Vite) → Photon Voice Cloud ↔ Unity Worker (headless) → NestJS API → PostgreSQL, S3 → Stripe Checkout Webhook.
  1. Функционал
    • Web-сцена ≥ 30 fps.
    • Пространственный голос ≤ 100 участников, авто-детект микрофона.
    • Донаты 1 / 5 / 10 USD, мгновенные уведомления.
    • Гостевая книга до 280 символов с /approve и /reject.
    • Автоперевод RU ↔ EN, подсветка субтитров.
  2. Нефункциональные показатели
    • LCP ≤ 3 с (4 G).
    • p95 задержка голоса ≤ 250 мс; p95 ASR→TTS ≤ 2 с, WER ≤ 7 %.
    • SLA backend ≥ 99,3 %.
    • GDPR-удаление данных ≤ 24 ч.
  3. Интерфейсы
    • HTTP GET /capsule/{id}.
    • WebSocket-каналы voice/*, donation/*, guestbook/*.
    • Webhook POST /stripe/webhook.
  4. Развёртывание: Helm-чарт seoma-capsule, pods spa, unity-worker, api, voice-gateway.
  5. Мониторинг: метрики capsule_voice_latency_ms, guestbook_post_total, lcp_ms; оповещения через Alertmanager → PagerDuty.
  6. План: июль — MVP 20 уч.; август — 60 уч. и перевод; сентябрь — 100 уч., нагрузочные тесты, code-freeze 25 сентября.
  7. Бюджет: Оплата труда — 65 000 USD; OPEX 1 850 USD/мес (Photon Voice 1 200 + ASR/TTS 250 + AWS 400).

4. Capsule-сцена «Музей / My Gallery»

1. Роли и права

  • Visitor — гость, не требует логина; может слушать экскурсию, задавать вопросы, жертвовать 5 USD, покупать копию, постер.
  • Artist/Creator — зарегистрированный пользователь; после e-mail/KYC-проверки создаёт собственную галерею, заливает работы, настраивает narration, цены, AI-эффекты и live-слоты.
  • Moderator — команда SEOMA; утверждает загруженные изображения, скрипты, AI-результаты, постеры, обрабатывает DMCA. (Опционально)
  • System-Daemon — фоновые задачи: SDXL-рендер, Face-Swap, отправка post-print webhook, пуш-напоминания live-туров.

2. Жизненный цикл контента для автора

  1. Создание галереи — кнопка Create My Gallery в личном кабинете, можно создавать до 20 отдельных Capsule-сцена “Музей”, соединенных в одно пространство.
  2. Загрузка изображений — до 50 файлов, проверка размера (≤ 25 MB) и min-resolution (3000 px).
  3. Семантический шаг «Narration»
    • Автор выбирает live / prerecorded / aiTTS; заполняет RU и EN скрипты ≤ 1000 симв.
    • Для prerecorded загружает MP4 ≤ 120 MB или нажимает Generate Audio — сервер формирует TTS-трек и сохраняет URL.
    • Чекбокс Enable Q&A разрешает 90-сек. блок вопросов.
  4. AI-Enhance
    • SDXL-стиль: выбирается из предустановок, результат показывается превью; списывается 1 кредит.
    • Face-Swap Poster: автор отмечает картину «доступна для Face-Swap», чтобы посетитель мог вставить своё селфи при покупке постера; списывается 2 кредита за тренировку LoRA.
  5. Commerce-настройки
    • Цена оригинала (≥ 10 USD), процент авторского royalty.
    • Цена Digital Copy (PNG 8K).
    • Постер фикс $15; если включён Face-Swap — $18.
  6. Layout — перетягивает картину на мини-плане зала, выбирает раму (classic / modern / no-frame) и ambient-FX (spot-light, мягкий шум).
  7. Live-Schedule (если есть хотя бы один mode = live) — до пяти слотов ISO-datetime; cron-таск позже разошлёт push-invites подписчикам.
  8. Publish — backend пишет JSON-конфиг в Postgres, кладёт изображения в S3, собирает Unity-AssetBundle и отдаёт ссылку вида capsule://gallery/van-gogh-study.

Галерея сразу появляется в публичном каталоге «New Exhibits».

3. Поведение сцены во время тура

  • При открытии deep-link клиент отправляет параметр lang. Если параметра нет, язык берётся из браузера; загружается правильный набор субтитров и аудио.
  • Collider-Enter у PaintingNode вызывает Narration Orchestrator:
    • проверяет расписание live, статус WebRTC художника и флаг mode;
    • если live и автор online — подключает его video-stream (голограмма) + Photon-voice;
    • иначе воспроизводит prerecorded-ролик или генерирует aiTTS-поток на лету (40-кГц XTTS).
  • Во время рассказа HUD отображает круговой таймер, индикатор LIVE (красный) или Recorded (серый), две иконки: Donate и Cart.
  • По окончании — если allowQuestions = true — открывается скрытый голосовой канал «Q&A-<paintingId>», таймер отсчитывает 90 с.
  • Любой вопрос транскрибируется Whisper; если это prerecorded/aiTTS режим, GPT формирует ответ ≤ 30 с, XTTS синтезирует, аватар «говорит».
  • Пользователь может нажать Donate $5 — моментально видит анимацию «звон монет» и счётчик пожертвований над полотном (+ имя в гостевой книге, если залогинен).
  • Нажатие Cart показывает товарную карточку: Original (если доступен), Digital Copy, Poster, Face-Swap Poster. Выбор отправляет Stripe Checkout (в веб) или IAP-sheet (мобайл).

4. Face-Swap Poster для посетителя и Photo2Video Pro (функционал из п.5)

  1. В карточке постера есть кнопка Create with my selfie.
  2. Открывается file input или камера; грузится JPEG ≤ 5 MB.
  3. AI-Worker запускает FaceFusion (≈ 25 сек в p95), результат сохраняется S3/faceswap/<uuid>.png.
  4. Превью показывается клиенту, тот подтверждает покупку — сумма $18 (15 + 3 за AI).
  5. После платы веб-hook /print/poster отправляет в типографию PNG + адрес.
  6. Можно оживить картину (Photo2Video Pro) и поделится ей.

5. Метрики и алерты

  • Каждое событие NarrationStart инкрементирует museum_narration_total{mode=live|prerecorded|aiTTS}.
  • Завершение Q&A пушит museum_qa_questions{mode=…} и museum_qa_answers.
  • Покупки и донаты логируются через painting_purchase_total{type=original|copy|poster} и museum_donation_usd_total.
  • Fallback live→aiTTS фиксируется museum_orchestrator_fallback_total.
  • Alert: если fallback rate > 30 % за 30 мин — PagerDuty «Author offline too often».

6. Безопасность, комплаенс

  • Загрузка изображений — LAION-NSFW v3; блокировка score > 0.9.
  • Face-Swap требует галочку «I own this selfie».
  • Все платежи происходят в PCI-namespace; токены IAP валидируются через App Store / Play.

  • GDPR-delete: автор или покупатель может подать запрос на удаление; cron-процедура стирает файлы S3 и метаданные ≤ 24 ч.
  • delete_raw_photos: true — исходные файлы фото стираются сразу после обучения аватара; хранение ≤ 2 мин.

7. Ключевые NFR-пороговые значения

  • LCP сцены с 20 полотнами ≤ 3 сек (4 G, mid-range Android 10).
  • GPU-util desktop ≤ 70 % (RTX 2060, 1080 p); мобайл ≤ 60 % (Snapdragon 8 Gen1, 30 fps).
  • p95 Voice-RTT ≤ 250 мс, p95 Whisper→GPT→TTS ≤ 2 сек.
  • p95 SDXL / Face-Swap ≤ 40 сек.
  • SLA API ≥ 99,3 %.

8. Moderation Service

  • Каждое изображение проходит LAION-NSFW v3. Если score < 0,70, сцена публикуется свободно; диапазон 0,70–0,95 помечается как 18+ и требует подтверждения перед просмотром, а экспорт постера автоматически получает watermark «18+ AI-modified». 
  • При score > 0,95 сцена доступна только приватно; попытка вывода в паблик отдается ошибкой 403 Explicit content
  • В аудио запускается Whisper-profanity; пользователь может нажать Report на явное нарушение, после чего Auto-takedown убирает контент в течение 30 минут.

9. Бюджет

  • Оплата труда — 32 000 USD.

5. Video-Avatar Studio β (включая Photo2Video Pro) — детальные требования

  1. Назначение — сервис REST, который по тексту генерирует ролик с 3-D-аватаром и SDXL-фоном; Photo2Video Pro создаёт talking-head-видео по фото.
  2. Архитектура
    • FastAPI Gateway, Orchestrator ↔ RabbitMQ, GPU-Workers (PyTorch + Three.js headless), Composer (FFmpeg), MinIO + PostgreSQL.
    • Adapter для внешних API (D-ID / HeyGen).
  3. Функционал
    • Приём JSON {text, language, tone, style} до 2 000 симв.
    • XTTS 50 кГц mono; визем-точность ≥ 95 % к фонемам; FPS ≥ 30.
    • SDXL-фон, опциональная четырёхсекундная петля.
    • Композитор H.264 High 4.1, CRF 18, 25 fps, 1080p.
    • Хранение результата 30 дней, затем авто-удаление; подписанная ссылка /video/{id}.
    • Photo2Video Pro: изображение ≤ 10 МБ, batch до 10 фото, fade 0,5 с.
  4. НФ-показатели
    • Текст 150 слов → ролик ≤ 120 с; 1 фото → видео ≤ 90 с.
    • SLA 99,5 % (99,2 % при учёте внешних API).
    • Поддержка 50 одновременных задач на узел, авто-скейл при GPU util > 70 %.
    • Формат: MP4 H.264 25 fps; AAC 128 kbps.
    • JWT + OAuth 2.0, TLS 1.3, OWASP Top-10; GDPR-удаление ≤ 30 дней.
    • NSFW-фильтры LAION-NSFW v3 (изображения) и Whisper profanity (аудио).
    • delete_raw_photos: true — исходные файлы фото стираются сразу после обучения аватара; хранение ≤ 2 мин.
  5. REST-эндпойнты
    • POST /video → 202 {id, status, eta}.
    • GET /video/{id} → MP4 / 404 / 410.
    • DELETE /video/{id} → 204.
    • POST /photo-video (multipart).
  6. Инфраструктура: Helm-чарт seoma-video; HPA по nvidia.com/gpu.utilization; CI/CD — GitHub Actions → Docker Buildx → Argo CD.
  7. Мониторинг: job_latency_seconds, gpu_utilization, nsfw_block_total, external_api_errors_total.
  8. План
    • Неделя 1 — ТЗ и UML.
    • Спринт 1 (2 нед) — API-skeleton, XTTS, визем-движок.
    • Спринт 2 — SDXL-фон, FFmpeg-композиция.
    • Спринт 3 — Kubernetes, CI/CD, SLA-мониторинг.
    • Спринт 4 — Adapter Photo2Video, кеш, batch-режим.
    • Неделя приёмки — нагрузка и безопасность.
  9. Бюджет
    • Базовый модуль — 40 000 USD (разработка 26 k + GPU dev/test 6 k + QA 8 k).
    • Photo2Video Pro — 33 000 USD (интеграция 6 k + API-кредиты 4 k + SLA 2 k).
    • Резервный бэкенд  — 5 000 USD, OPEX — on-demand AWS A100-80 GB × 2 ≈ 2 700 USD/мес
    • Совокупная оплата труда — 78 000 USD; OPEX — 4 300 USD/мес.

6. Mobile Suite 1.0 — детальные требования

  1. Цель — универсальное мобильное приложение для Capsule-Live, донатов и AI-Studio; платформы iOS 15+ и Android 10+.
  2. Архитектура — React Native 0.74 / Expo 51 ↔ GraphQL Gateway (NestJS) → Stripe Server (Checkout + Billing + Connect) → Photon Voice, FCM / APNS.
  3. Функционал
    • Deep-link capsule://{id} открывает сцену во встроенном WebView.
    • In-App Purchase: донаты 1 / 5 / 10 USD + custom Tier 1–10; покупка кредитов 50 / 200 / 500.
    • Emoji-реакции 🎉 ❤️ 👏 с p95-задержкой ≤ 200 мс.
    • Локализация RU, EN, ES; автоматическая светлая / тёмная тема.
    • Интеграция Crashlytics и Sentry.
    • Stripe Billing: покупка/продление планов, управление пробным периодом.
      Stripe Connect: отображение баланса gift_credit и истории выплат автору.
  4. НФ-показатели
    • APK / AAB ≤ 80 MB, IPA ≤ 150 MB.
    • Cold-start median ≤ 2 с (Pixel 7).
    • Разряд батареи < 5 % за 30-минутную сессию.
    • Полное соответствие политикам App Store и Google Play.
  5. Интерфейсы
    • GraphQL queries Capsule(id); mutations Donate, BuyCredits, GenerateVideo, StartSubscription, mutation BuyBooster(sku).
    • REST-прокси к Video-Avatar API.
  6. Развёртывание — EAS Build, TestFlight, Play Internal Track; проверки App Attest и Play Integrity.
  7. Мониторинг — mobile_push_delivery_total, Crashlytics crash-rate, Sentry issues, время запуска.
  8. План: июль — push + WebView; август — IAP и emoji; сентябрь — TestFlight / Internal, финальный релиз.
  9. Бюджет — Оплата труда — 69 000 USD; OPEX 180 USD/мес (FCM/APNS 50 + Store 30 + AWS 100).

7. Общая инфраструктура и процессы

  • Kubernetes (AWS EKS) с namespace для каждого продукта; GPU-ноды помечены taint gpu=true.
  • Helm-чарты: seoma-capsule, seoma-video, seoma-mobile.
  • Сквозной CI/CD: GitHub Actions → Docker Buildx → Argo CD sync.
  • Secrets — SOPS-KMS и Vault; платежные компоненты вынесены в PCI-DSS-scope namespace.
  • Единый мониторинг: Prometheus, Grafana, Loki, Tempo; Alertmanager пересылает оповещения в PagerDuty.
  • Guilds — MVP 0.1. Пользователь во время регистрации выбирает одну из семи гильдий — Artists, Teachers, Musicians, Therapists, Gamers, Fitness, Makers; можно пропустить. Выбор сохраняется в поле guild_id таблицы users.
    REST-эндпойнты:
    POST /join-guild — сохранить выбранный id;
    GET /guild-feed — вернуть список Capsule-сцен авторов той же гильдии, сортировка по просмотрам за последние 24 ч.
    В мобильном приложении появляется вкладка Guild, где отображается эта лента. Метрики: guild_join_total, guild_feed_view_total, guild_scene_click_total. NSFW-правила те же, что для остальных сцен.

8. Сводный бюджет и эксплуатационные расходы

  • Capsule-Live v 1.3 — Оплата труда — 65 000 USD; ежемесячный OPEX 1 850 USD (Photon Voice 1 200 + ASR/TTS 250 + AWS 400); разово 3 700 USD — покупка 10 сцен.
  • My Gallery — Оплата труда — 32 000 USD
  • Video-Avatar Studio β — Оплата труда — 78 000 USD; ежемесячный OPEX 4 300 USD (2 700 (резервный кластер)  + GPU 600 + TTS/SDXL 400 + S3 100 + внешние API 333 + SLA/мониторинг 167).
  • Mobile Suite 1.0 — Оплата труда — 69 000 USD; ежемесячный OPEX 180 USD (FCM/APNS 50 + Store 30 + AWS 100).

Совокупные капитальные затраты на зарплатный фонд — 247 700 USD.
Совокупный ежемесячный OPEX — около 6 330 USD.


9. Development Process & Reporting

process:
sprint_length_days: 14      # стандартный двухнедельный спринт
daily_standup:              # ежедневный 10-мин статус-кружок
time: «10:00 CET»
format: «Done / Doing / Blockers»
artefacts:
— sprint_demo: live-ссылка + changelog.md
— sprint_retro: 2-3 action-items в Jira
— weekly_digest: Slack-сообщение #seoma-management (готово / риски)
— burndown_chart: auto из Jira → Grafana панель
milestones:
— name: MVP_internal
date: «2025-08-31»
gate: «инкремент открыт тестерам»
— name: Code_Freeze
date: «2025-10-10»
gate: «все фичи в main, только баг-фиксы»
— name: GA_Launch
date: «2025-10-25»
gate: «Go/No-Go checklist подписан»

Ответственные

roles: scrum_master:  «Виталий» product_owner: «Ты» qa_lead:   «Вячеслав Зверев»

10. Таблица сравнения разных ИИ для Photo2Video 

#СервисКлючевой типAPIВозможности / фишкиДоступ / цены за 1 секКогда выбирать
1MidJourney (Video)Text-/Image-to-Video, ≤10 c, 720 pПараметры —motion low/high, —raw, Fast / Relax Mode; ~8× GPU-время от картинки (docs.midjourney.com)≈ $0.1Нужно быстро анимировать «картинку в движении» без кода
2Topaz Video AI 7Upscale / Enhance24 модели: upscaling до 8K, стабилизация, шумопонижение (topazlabs.com)≈ $0.15Реставрация/повышение качества уже снятого видео
3Runway Gen-4Text-/Image-to-VideoРеалистичная физика, согласованность объектов, «production-ready» (runwayml.com)≈ $0.18Короткие кинематографичные сцены под монтаж
4Kling 2.1Text / Image → 1080 p видеоБыстрый 5 с output, Multi-Elements (удалять/добавлять детали) (pollo.ai)≈ $0.12Нужна китайская модель с детальной анимацией
5Veo 3 (Google)Text-to-Video + нативный звукГенерирует видео + SFX / диалоги; высокий реализм (deepmind.google)≈ $0.90R&D, когда доступ откроют
6HiggsfieldPrompt-to-Cinematic-Move«Кран», «буллет-тайм», сложные камеры одним кликом (higgsfield.ai)≈ $0.18Эффектные motion-шоты для соцсетей
7Sora (OpenAI)Универсальный T2V720 p / 10 c, любой стиль, мультимодальные входы (openai.com)≈ $0.50Стратегический мониторинг; интеграции позже
8Hailuo MiniMaxText/Image → видеоБыстрые клипы, 360° орбита камеры, агент-пресеты (hailuoai.video)≈ $0.30Визуальные эффекты «из коробки» без кода
9HeyGenTalking-Avatar100+ языков, Face-& Voice clone; streaming-аватары (heygen.com)≈ $0.18Маркетинг, e-learning видеоролики с «говорящей» головой
10Hedra (Character-3)Expressive talking / singing 3D✔ (beta)Omnimodal (текст + изобр.+ аудио), эмоции, lipsync (hedra-ai.com)≈ $0.22Креативные клипы с мультяшным или реал. персонажем
11Pika Labs 2.xText / Image → короткие видеоPikaSwaps, Video-to-Video, эффекты «inflate/melt» (pollo.ai)≈ $0.12Быстрые мем-ролики, B-roll для соцсетей
12Act-One (Avatars 2.0)Video-driven Character AnimПеренос мимики из driving-video без рига (runwayml.com)≈ $0.22Живая анимация иллюстраций, time-travel эффекты
13Luma Dream MachineText/Image → 10 c 1080 pТочные 3D-траектории, API, iOS / Web UX (en.wikipedia.org)≈ $0.19Реалистичные физ-шоты, быстрый сторибординг
14RW: Стилизатор*Video-to-Video Style TransferЗагружаете своё видео + референс-кадр → стильный ролик (domoai.app)≈ $0.26Художественная перекраска под любой арт-стиль
15D-ID AvatarsTalking HeadФото → видео, real-time streaming, 100+ языков (d-id.com)≈ $0.19Персональные ассистенты, боты, презентации
16«Синхронизатор губ» (Wav2Lip)Lip-sync post-proc✔ (open-source SaaS)Точное совмещение аудио и губ на любом видео (wav2lip.org)≈ $0.1Дубляж, перевод, правка уже готового контента