Версия 0.8 — 8 июля 2025 г.
Рабочий период: 1 июля → 1 октября 2025 г. (три полных месяца)
1. Введение и цели
К 1 октября 2025 года планируется публичный релиз трёх ключевых продуктов экосистемы SEOMA.
- SEOMA-Capsule-Live v 1.3 (GA) — трёхмерная Web-сцена с групповым голосом до 100 человек, донатами и двусторонним автопереводом речи RU ↔ EN.
- Video-Avatar Studio (β-доступ авторам) — облачная студия, генерирующая 60-секундные видеоролики 1080p, поддерживающая Photo2Video Pro и персональные 3-D-аватары.
- Mobile Suite 1.0 (iOS / Android) — одно мобильное приложение для мгновенного входа в Capsule-Live, донатов, покупки кредитов и создания AI-роликов с push-deep-links.
2. Периметр проекта и основные продукты
2.1 Capsule-Live v 1.3
- Трёхмерная WebGL / WebGPU-сцена, стабильные 30 fps и выше.
- Групповой пространственный голос на базе Photon Voice (до 100 участников) с автопереводом RU ↔ EN и субтитрами.
- Донаты через Stripe Checkout (быстрые пресеты 1 / 5 / 10 USD).
- Текстовая гостевая книга с REST-модерацией.
- Целевой выпуск GA — 1 октября 2025 г.
2.2 Video-Avatar Studio β (включая Photo2Video Pro)
- SPA + REST-API для генерации роликов 1080p / 25 fps длительностью 60 с.
- Библиотека: десять базовых 3-D / 2-D персонажей, десять фоновых шаблонов, не менее двадцати голосов XTTS.
- Персональный аватар создаётся из одной-трёх фотографий и доступен как в Studio, так и в Capsule-Live.
- Photo2Video Pro: одно фото + текст → 15 / 30 / 60 с talking-head; пакетная обработка до десяти фото.
- Монетизация через Stripe Credits (пакеты 50 / 200 / 500); типовой ролик — 10 кредитов, Photo2Video — 5.
- Доступ по whitelist к 1 октября 2025 г.
2.3 Mobile Suite 1.0
- Реализация на React Native 0.74 / Expo 51.
- Deep-link вида capsule://{id} открывает нужную Capsule во встроенном WebView.
- In-App Purchase для донатов (1 / 5 / 10 USD + кастомные суммы) и кредитных пакетов 50 / 200 / 500.
- Вкладка “Studio” использует тот же REST-API, что и веб-версия.
- Push-уведомления (FCM / APNS), Crashlytics, Sentry; локализация RU / EN / ES, светлая и тёмная темы.
- Публичный релиз планируется до 1 октября 2025 г.
2.4 Стартовая библиотека сцен (шаблоны Capsule-мира)
- 10 готовых локаций:
гостиная • класс • галерея • малый клуб • парк 360° • чёрная студия • кафе-ко-воркинг • тропический пляж • кибер-лофт • мини-театр. - Доступны в мастере Create Capsule; у каждой сцены — преднастроенные Anchor-точки, свет, гостевая книга, донат-UI.
- Ассеты Unity Asset Store, суммарная закупка ≤ 3 700 USD.
- Сроки: покупка + юр-проверка до 18 июля, asset-freeze в S3 и подключение к мастеру до 20 августа.
- Ограничения производительности: Bundle ≤ 45 MB, LCP ≤ 2,5 с (4 G), p50 fps ≥ 40 (desktop) / ≥ 30 (Pixel 7).
2.5 Commercial model
- Для авторов вводится тариф Creator Annual 50 Gift. Лицензия стоит 49 € в год и сразу начисляет невозвратный подарочный кредит 50 USD, эквивалентный публикации 50 аватаров и 50 Capsule-сцен. В профиле пользователя появляются поля plan_tier, gift_balance, avatars_left, scenes_left.
- Любой платеж внутри экосистемы «разрезается» автоматически: 75 % уходит автору, 25 % — SEOMA. Сплит выполняет Stripe Connect; выплаты перечисляются автору первого числа каждого месяца на счёт Qonto (параметр payout_schedule=»monthly»). Сводный отчёт за период приходит автору по webhook-ссылке monthly_report.pdf.
2.6 Pricing & Plans
В экосистеме действует три потребительских плана.
- Free Preview: 0 USD, 1 аватар, 1 сцена, 15-секундное видео 720 p, watermark, авто-удаление через сутки.
- Creator Monthly: 9 USD/мес, 5 аватаров, 5 сцен, хранение 30 дней, без переноса остатков.
- Creator Annual 50 Gift (launch-price до 31.12.2025): 49 USD/год, сразу дарит кредит 50 USD, 50 аватаров, 50 сцен, хранение 365 дней, при продлении кредит возобновляется.
Покупка бустеров возможна только при активном плане.
purchase_booster_requires_plan: true // Бустеры продаются только при активном Monthly или Annual плане
Партия промо-купов launch2025Q3 (5 000 шт.) обнуляет стоимость годового плана до 31 октября 2025 г.
Единственные платёжные провайдеры — Stripe, Apple IAP, Google Play Billing; revenue-split 75 / 25, ежемесячная выплата через Stripe Connect, окно возврата средств 14 дней, если лимиты не израсходованы.
| Уровень | Цена | Что даём | Зачем нужно |
| Free Preview | 0 USD | 1 аватар (15 сек, 720p, watermark); 1 черновик Capsule-сцены (приватно, ≤24 ч, watermark); просмотр чужих Capsule, участие в Live-турах, донаты | Снять барьер «пощупать руками»; собрать email/соц-логин; вызвать желание «без ватермарка и подольше» |
| Creator Monthly | 9 USD / мес | 5 аватаров + 5 сцен; доступ к маркетплейсу; 25 GB хранения 30 дней | Низкий порог входа, измерение churn / LTV |
| Creator Annual 50 Gift (launch) | 49 USD / год + 50 USD кредит (50 аватаров + 50 сцен) | 100 GB хранения 1 год; доступ к Exact Likeness; badge “Early Creator ’25” | Максимальный LTV сразу при «магически низкой» цене |
2.7 Realism Preset.
По умолчанию весь визуальный/аудиоконтент рендерится в режиме ≤ 95 % realism: алгоритм вносит лёгкий шум, цветовой дрейф до ±3 % и ограничивает резкость. Опция Exact Likeness ≈ 100 % разблокируется только после того, как пользователь ставит галочку «I own (or have model-release for) this likeness». При таком выборе итоговый файл получает визуальный ярлык AI-modified. Значение пресета передаётся полем realism_preset ( «95» | «100» ) во все вызовы XTTS, SDXL и Face-Swap; метрика avatar_realism_total фиксирует распределение по пресетам.
3. Capsule-Live v 1.3 — детальные требования
- Архитектура: SPA (Vite) → Photon Voice Cloud ↔ Unity Worker (headless) → NestJS API → PostgreSQL, S3 → Stripe Checkout Webhook.
- Функционал
- Web-сцена ≥ 30 fps.
- Пространственный голос ≤ 100 участников, авто-детект микрофона.
- Донаты 1 / 5 / 10 USD, мгновенные уведомления.
- Гостевая книга до 280 символов с /approve и /reject.
- Автоперевод RU ↔ EN, подсветка субтитров.
- Web-сцена ≥ 30 fps.
- Нефункциональные показатели
- LCP ≤ 3 с (4 G).
- p95 задержка голоса ≤ 250 мс; p95 ASR→TTS ≤ 2 с, WER ≤ 7 %.
- SLA backend ≥ 99,3 %.
- GDPR-удаление данных ≤ 24 ч.
- LCP ≤ 3 с (4 G).
- Интерфейсы
- HTTP GET /capsule/{id}.
- WebSocket-каналы voice/*, donation/*, guestbook/*.
- Webhook POST /stripe/webhook.
- HTTP GET /capsule/{id}.
- Развёртывание: Helm-чарт seoma-capsule, pods spa, unity-worker, api, voice-gateway.
- Мониторинг: метрики capsule_voice_latency_ms, guestbook_post_total, lcp_ms; оповещения через Alertmanager → PagerDuty.
- План: июль — MVP 20 уч.; август — 60 уч. и перевод; сентябрь — 100 уч., нагрузочные тесты, code-freeze 25 сентября.
- Бюджет: Оплата труда — 65 000 USD; OPEX 1 850 USD/мес (Photon Voice 1 200 + ASR/TTS 250 + AWS 400).
4. Capsule-сцена «Музей / My Gallery»
1. Роли и права
- Visitor — гость, не требует логина; может слушать экскурсию, задавать вопросы, жертвовать 5 USD, покупать копию, постер.
- Artist/Creator — зарегистрированный пользователь; после e-mail/KYC-проверки создаёт собственную галерею, заливает работы, настраивает narration, цены, AI-эффекты и live-слоты.
- Moderator — команда SEOMA; утверждает загруженные изображения, скрипты, AI-результаты, постеры, обрабатывает DMCA. (Опционально)
- System-Daemon — фоновые задачи: SDXL-рендер, Face-Swap, отправка post-print webhook, пуш-напоминания live-туров.
2. Жизненный цикл контента для автора
- Создание галереи — кнопка Create My Gallery в личном кабинете, можно создавать до 20 отдельных Capsule-сцена “Музей”, соединенных в одно пространство.
- Загрузка изображений — до 50 файлов, проверка размера (≤ 25 MB) и min-resolution (3000 px).
- Семантический шаг «Narration»
- Автор выбирает live / prerecorded / aiTTS; заполняет RU и EN скрипты ≤ 1000 симв.
- Для prerecorded загружает MP4 ≤ 120 MB или нажимает Generate Audio — сервер формирует TTS-трек и сохраняет URL.
- Чекбокс Enable Q&A разрешает 90-сек. блок вопросов.
- Автор выбирает live / prerecorded / aiTTS; заполняет RU и EN скрипты ≤ 1000 симв.
- AI-Enhance
- SDXL-стиль: выбирается из предустановок, результат показывается превью; списывается 1 кредит.
- Face-Swap Poster: автор отмечает картину «доступна для Face-Swap», чтобы посетитель мог вставить своё селфи при покупке постера; списывается 2 кредита за тренировку LoRA.
- SDXL-стиль: выбирается из предустановок, результат показывается превью; списывается 1 кредит.
- Commerce-настройки
- Цена оригинала (≥ 10 USD), процент авторского royalty.
- Цена Digital Copy (PNG 8K).
- Постер фикс $15; если включён Face-Swap — $18.
- Цена оригинала (≥ 10 USD), процент авторского royalty.
- Layout — перетягивает картину на мини-плане зала, выбирает раму (classic / modern / no-frame) и ambient-FX (spot-light, мягкий шум).
- Live-Schedule (если есть хотя бы один mode = live) — до пяти слотов ISO-datetime; cron-таск позже разошлёт push-invites подписчикам.
- Publish — backend пишет JSON-конфиг в Postgres, кладёт изображения в S3, собирает Unity-AssetBundle и отдаёт ссылку вида capsule://gallery/van-gogh-study.
Галерея сразу появляется в публичном каталоге «New Exhibits».
3. Поведение сцены во время тура
- При открытии deep-link клиент отправляет параметр lang. Если параметра нет, язык берётся из браузера; загружается правильный набор субтитров и аудио.
- Collider-Enter у PaintingNode вызывает Narration Orchestrator:
- проверяет расписание live, статус WebRTC художника и флаг mode;
- если live и автор online — подключает его video-stream (голограмма) + Photon-voice;
- иначе воспроизводит prerecorded-ролик или генерирует aiTTS-поток на лету (40-кГц XTTS).
- проверяет расписание live, статус WebRTC художника и флаг mode;
- Во время рассказа HUD отображает круговой таймер, индикатор LIVE (красный) или Recorded (серый), две иконки: Donate и Cart.
- По окончании — если allowQuestions = true — открывается скрытый голосовой канал «Q&A-<paintingId>», таймер отсчитывает 90 с.
- Любой вопрос транскрибируется Whisper; если это prerecorded/aiTTS режим, GPT формирует ответ ≤ 30 с, XTTS синтезирует, аватар «говорит».
- Пользователь может нажать Donate $5 — моментально видит анимацию «звон монет» и счётчик пожертвований над полотном (+ имя в гостевой книге, если залогинен).
- Нажатие Cart показывает товарную карточку: Original (если доступен), Digital Copy, Poster, Face-Swap Poster. Выбор отправляет Stripe Checkout (в веб) или IAP-sheet (мобайл).
4. Face-Swap Poster для посетителя и Photo2Video Pro (функционал из п.5)
- В карточке постера есть кнопка Create with my selfie.
- Открывается file input или камера; грузится JPEG ≤ 5 MB.
- AI-Worker запускает FaceFusion (≈ 25 сек в p95), результат сохраняется S3/faceswap/<uuid>.png.
- Превью показывается клиенту, тот подтверждает покупку — сумма $18 (15 + 3 за AI).
- После платы веб-hook /print/poster отправляет в типографию PNG + адрес.
- Можно оживить картину (Photo2Video Pro) и поделится ей.
5. Метрики и алерты
- Каждое событие NarrationStart инкрементирует museum_narration_total{mode=live|prerecorded|aiTTS}.
- Завершение Q&A пушит museum_qa_questions{mode=…} и museum_qa_answers.
- Покупки и донаты логируются через painting_purchase_total{type=original|copy|poster} и museum_donation_usd_total.
- Fallback live→aiTTS фиксируется museum_orchestrator_fallback_total.
- Alert: если fallback rate > 30 % за 30 мин — PagerDuty «Author offline too often».
6. Безопасность, комплаенс
- Загрузка изображений — LAION-NSFW v3; блокировка score > 0.9.
- Face-Swap требует галочку «I own this selfie».
- Все платежи происходят в PCI-namespace; токены IAP валидируются через App Store / Play.
- GDPR-delete: автор или покупатель может подать запрос на удаление; cron-процедура стирает файлы S3 и метаданные ≤ 24 ч.
- delete_raw_photos: true — исходные файлы фото стираются сразу после обучения аватара; хранение ≤ 2 мин.
7. Ключевые NFR-пороговые значения
- LCP сцены с 20 полотнами ≤ 3 сек (4 G, mid-range Android 10).
- GPU-util desktop ≤ 70 % (RTX 2060, 1080 p); мобайл ≤ 60 % (Snapdragon 8 Gen1, 30 fps).
- p95 Voice-RTT ≤ 250 мс, p95 Whisper→GPT→TTS ≤ 2 сек.
- p95 SDXL / Face-Swap ≤ 40 сек.
- SLA API ≥ 99,3 %.
8. Moderation Service
- Каждое изображение проходит LAION-NSFW v3. Если score < 0,70, сцена публикуется свободно; диапазон 0,70–0,95 помечается как 18+ и требует подтверждения перед просмотром, а экспорт постера автоматически получает watermark «18+ AI-modified».
- При score > 0,95 сцена доступна только приватно; попытка вывода в паблик отдается ошибкой 403 Explicit content.
- В аудио запускается Whisper-profanity; пользователь может нажать Report на явное нарушение, после чего Auto-takedown убирает контент в течение 30 минут.
9. Бюджет
- Оплата труда — 32 000 USD.
5. Video-Avatar Studio β (включая Photo2Video Pro) — детальные требования
- Назначение — сервис REST, который по тексту генерирует ролик с 3-D-аватаром и SDXL-фоном; Photo2Video Pro создаёт talking-head-видео по фото.
- Архитектура
- FastAPI Gateway, Orchestrator ↔ RabbitMQ, GPU-Workers (PyTorch + Three.js headless), Composer (FFmpeg), MinIO + PostgreSQL.
- Adapter для внешних API (D-ID / HeyGen).
- FastAPI Gateway, Orchestrator ↔ RabbitMQ, GPU-Workers (PyTorch + Three.js headless), Composer (FFmpeg), MinIO + PostgreSQL.
- Функционал
- Приём JSON {text, language, tone, style} до 2 000 симв.
- XTTS 50 кГц mono; визем-точность ≥ 95 % к фонемам; FPS ≥ 30.
- SDXL-фон, опциональная четырёхсекундная петля.
- Композитор H.264 High 4.1, CRF 18, 25 fps, 1080p.
- Хранение результата 30 дней, затем авто-удаление; подписанная ссылка /video/{id}.
- Photo2Video Pro: изображение ≤ 10 МБ, batch до 10 фото, fade 0,5 с.
- Приём JSON {text, language, tone, style} до 2 000 симв.
- НФ-показатели
- Текст 150 слов → ролик ≤ 120 с; 1 фото → видео ≤ 90 с.
- SLA 99,5 % (99,2 % при учёте внешних API).
- Поддержка 50 одновременных задач на узел, авто-скейл при GPU util > 70 %.
- Формат: MP4 H.264 25 fps; AAC 128 kbps.
- JWT + OAuth 2.0, TLS 1.3, OWASP Top-10; GDPR-удаление ≤ 30 дней.
- NSFW-фильтры LAION-NSFW v3 (изображения) и Whisper profanity (аудио).
- delete_raw_photos: true — исходные файлы фото стираются сразу после обучения аватара; хранение ≤ 2 мин.
- Текст 150 слов → ролик ≤ 120 с; 1 фото → видео ≤ 90 с.
- REST-эндпойнты
- POST /video → 202 {id, status, eta}.
- GET /video/{id} → MP4 / 404 / 410.
- DELETE /video/{id} → 204.
- POST /photo-video (multipart).
- POST /video → 202 {id, status, eta}.
- Инфраструктура: Helm-чарт seoma-video; HPA по nvidia.com/gpu.utilization; CI/CD — GitHub Actions → Docker Buildx → Argo CD.
- Мониторинг: job_latency_seconds, gpu_utilization, nsfw_block_total, external_api_errors_total.
- План
- Неделя 1 — ТЗ и UML.
- Спринт 1 (2 нед) — API-skeleton, XTTS, визем-движок.
- Спринт 2 — SDXL-фон, FFmpeg-композиция.
- Спринт 3 — Kubernetes, CI/CD, SLA-мониторинг.
- Спринт 4 — Adapter Photo2Video, кеш, batch-режим.
- Неделя приёмки — нагрузка и безопасность.
- Неделя 1 — ТЗ и UML.
- Бюджет
- Базовый модуль — 40 000 USD (разработка 26 k + GPU dev/test 6 k + QA 8 k).
- Photo2Video Pro — 33 000 USD (интеграция 6 k + API-кредиты 4 k + SLA 2 k).
- Резервный бэкенд — 5 000 USD, OPEX — on-demand AWS A100-80 GB × 2 ≈ 2 700 USD/мес
- Совокупная оплата труда — 78 000 USD; OPEX — 4 300 USD/мес.
- Базовый модуль — 40 000 USD (разработка 26 k + GPU dev/test 6 k + QA 8 k).
6. Mobile Suite 1.0 — детальные требования
- Цель — универсальное мобильное приложение для Capsule-Live, донатов и AI-Studio; платформы iOS 15+ и Android 10+.
- Архитектура — React Native 0.74 / Expo 51 ↔ GraphQL Gateway (NestJS) → Stripe Server (Checkout + Billing + Connect) → Photon Voice, FCM / APNS.
- Функционал
- Deep-link capsule://{id} открывает сцену во встроенном WebView.
- In-App Purchase: донаты 1 / 5 / 10 USD + custom Tier 1–10; покупка кредитов 50 / 200 / 500.
- Emoji-реакции 🎉 ❤️ 👏 с p95-задержкой ≤ 200 мс.
- Локализация RU, EN, ES; автоматическая светлая / тёмная тема.
- Интеграция Crashlytics и Sentry.
- Stripe Billing: покупка/продление планов, управление пробным периодом.
Stripe Connect: отображение баланса gift_credit и истории выплат автору.
- Deep-link capsule://{id} открывает сцену во встроенном WebView.
- НФ-показатели
- APK / AAB ≤ 80 MB, IPA ≤ 150 MB.
- Cold-start median ≤ 2 с (Pixel 7).
- Разряд батареи < 5 % за 30-минутную сессию.
- Полное соответствие политикам App Store и Google Play.
- APK / AAB ≤ 80 MB, IPA ≤ 150 MB.
- Интерфейсы
- GraphQL queries Capsule(id); mutations Donate, BuyCredits, GenerateVideo, StartSubscription, mutation BuyBooster(sku).
- REST-прокси к Video-Avatar API.
- GraphQL queries Capsule(id); mutations Donate, BuyCredits, GenerateVideo, StartSubscription, mutation BuyBooster(sku).
- Развёртывание — EAS Build, TestFlight, Play Internal Track; проверки App Attest и Play Integrity.
- Мониторинг — mobile_push_delivery_total, Crashlytics crash-rate, Sentry issues, время запуска.
- План: июль — push + WebView; август — IAP и emoji; сентябрь — TestFlight / Internal, финальный релиз.
- Бюджет — Оплата труда — 69 000 USD; OPEX 180 USD/мес (FCM/APNS 50 + Store 30 + AWS 100).
7. Общая инфраструктура и процессы
- Kubernetes (AWS EKS) с namespace для каждого продукта; GPU-ноды помечены taint gpu=true.
- Helm-чарты: seoma-capsule, seoma-video, seoma-mobile.
- Сквозной CI/CD: GitHub Actions → Docker Buildx → Argo CD sync.
- Secrets — SOPS-KMS и Vault; платежные компоненты вынесены в PCI-DSS-scope namespace.
- Единый мониторинг: Prometheus, Grafana, Loki, Tempo; Alertmanager пересылает оповещения в PagerDuty.
- Guilds — MVP 0.1. Пользователь во время регистрации выбирает одну из семи гильдий — Artists, Teachers, Musicians, Therapists, Gamers, Fitness, Makers; можно пропустить. Выбор сохраняется в поле guild_id таблицы users.
REST-эндпойнты:
POST /join-guild — сохранить выбранный id;
GET /guild-feed — вернуть список Capsule-сцен авторов той же гильдии, сортировка по просмотрам за последние 24 ч.
В мобильном приложении появляется вкладка Guild, где отображается эта лента. Метрики: guild_join_total, guild_feed_view_total, guild_scene_click_total. NSFW-правила те же, что для остальных сцен.
8. Сводный бюджет и эксплуатационные расходы
- Capsule-Live v 1.3 — Оплата труда — 65 000 USD; ежемесячный OPEX 1 850 USD (Photon Voice 1 200 + ASR/TTS 250 + AWS 400); разово 3 700 USD — покупка 10 сцен.
- My Gallery — Оплата труда — 32 000 USD
- Video-Avatar Studio β — Оплата труда — 78 000 USD; ежемесячный OPEX 4 300 USD (2 700 (резервный кластер) + GPU 600 + TTS/SDXL 400 + S3 100 + внешние API 333 + SLA/мониторинг 167).
- Mobile Suite 1.0 — Оплата труда — 69 000 USD; ежемесячный OPEX 180 USD (FCM/APNS 50 + Store 30 + AWS 100).
Совокупные капитальные затраты на зарплатный фонд — 247 700 USD.
Совокупный ежемесячный OPEX — около 6 330 USD.
9. Development Process & Reporting
process:
sprint_length_days: 14 # стандартный двухнедельный спринт
daily_standup: # ежедневный 10-мин статус-кружок
time: «10:00 CET»
format: «Done / Doing / Blockers»
artefacts:
— sprint_demo: live-ссылка + changelog.md
— sprint_retro: 2-3 action-items в Jira
— weekly_digest: Slack-сообщение #seoma-management (готово / риски)
— burndown_chart: auto из Jira → Grafana панель
milestones:
— name: MVP_internal
date: «2025-08-31»
gate: «инкремент открыт тестерам»
— name: Code_Freeze
date: «2025-10-10»
gate: «все фичи в main, только баг-фиксы»
— name: GA_Launch
date: «2025-10-25»
gate: «Go/No-Go checklist подписан»
Ответственные
roles: scrum_master: «Виталий» product_owner: «Ты» qa_lead: «Вячеслав Зверев»
10. Таблица сравнения разных ИИ для Photo2Video
| # | Сервис | Ключевой тип | API | Возможности / фишки | Доступ / цены за 1 сек | Когда выбирать |
| 1 | MidJourney (Video) | Text-/Image-to-Video, ≤10 c, 720 p | ✔ | Параметры —motion low/high, —raw, Fast / Relax Mode; ~8× GPU-время от картинки (docs.midjourney.com) | ≈ $0.1 | Нужно быстро анимировать «картинку в движении» без кода |
| 2 | Topaz Video AI 7 | Upscale / Enhance | ✔ | 24 модели: upscaling до 8K, стабилизация, шумопонижение (topazlabs.com) | ≈ $0.15 | Реставрация/повышение качества уже снятого видео |
| 3 | Runway Gen-4 | Text-/Image-to-Video | ✔ | Реалистичная физика, согласованность объектов, «production-ready» (runwayml.com) | ≈ $0.18 | Короткие кинематографичные сцены под монтаж |
| 4 | Kling 2.1 | Text / Image → 1080 p видео | ✔ | Быстрый 5 с output, Multi-Elements (удалять/добавлять детали) (pollo.ai) | ≈ $0.12 | Нужна китайская модель с детальной анимацией |
| 5 | Veo 3 (Google) | Text-to-Video + нативный звук | ✔ | Генерирует видео + SFX / диалоги; высокий реализм (deepmind.google) | ≈ $0.90 | R&D, когда доступ откроют |
| 6 | Higgsfield | Prompt-to-Cinematic-Move | ✔ | «Кран», «буллет-тайм», сложные камеры одним кликом (higgsfield.ai) | ≈ $0.18 | Эффектные motion-шоты для соцсетей |
| 7 | Sora (OpenAI) | Универсальный T2V | ✔ | 720 p / 10 c, любой стиль, мультимодальные входы (openai.com) | ≈ $0.50 | Стратегический мониторинг; интеграции позже |
| 8 | Hailuo MiniMax | Text/Image → видео | ✔ | Быстрые клипы, 360° орбита камеры, агент-пресеты (hailuoai.video) | ≈ $0.30 | Визуальные эффекты «из коробки» без кода |
| 9 | HeyGen | Talking-Avatar | ✔ | 100+ языков, Face-& Voice clone; streaming-аватары (heygen.com) | ≈ $0.18 | Маркетинг, e-learning видеоролики с «говорящей» головой |
| 10 | Hedra (Character-3) | Expressive talking / singing 3D | ✔ (beta) | Omnimodal (текст + изобр.+ аудио), эмоции, lipsync (hedra-ai.com) | ≈ $0.22 | Креативные клипы с мультяшным или реал. персонажем |
| 11 | Pika Labs 2.x | Text / Image → короткие видео | ✔ | PikaSwaps, Video-to-Video, эффекты «inflate/melt» (pollo.ai) | ≈ $0.12 | Быстрые мем-ролики, B-roll для соцсетей |
| 12 | Act-One (Avatars 2.0) | Video-driven Character Anim | ✔ | Перенос мимики из driving-video без рига (runwayml.com) | ≈ $0.22 | Живая анимация иллюстраций, time-travel эффекты |
| 13 | Luma Dream Machine | Text/Image → 10 c 1080 p | ✔ | Точные 3D-траектории, API, iOS / Web UX (en.wikipedia.org) | ≈ $0.19 | Реалистичные физ-шоты, быстрый сторибординг |
| 14 | RW: Стилизатор* | Video-to-Video Style Transfer | ✔ | Загружаете своё видео + референс-кадр → стильный ролик (domoai.app) | ≈ $0.26 | Художественная перекраска под любой арт-стиль |
| 15 | D-ID Avatars | Talking Head | ✔ | Фото → видео, real-time streaming, 100+ языков (d-id.com) | ≈ $0.19 | Персональные ассистенты, боты, презентации |
| 16 | «Синхронизатор губ» (Wav2Lip) | Lip-sync post-proc | ✔ (open-source SaaS) | Точное совмещение аудио и губ на любом видео (wav2lip.org) | ≈ $0.1 | Дубляж, перевод, правка уже готового контента |
