MiniMax представляет Hailuo Video Agent и Voice Design, расширяя свои мультимодальные возможности ИИ
Коротко Компания MiniMax завершила неделю анонсов своих продуктов запуском Hailuo Video Agent — инструмента для создания видео на базе искусственного интеллекта, а также Voice Design — многоязычного генератора текста в речь.
Китайская компания ИИ MiniMax объявила о запуске Hailuo Video Agent в бета-фазе. Это приложение на основе ИИ преобразует простые текстовые или графические подсказки в короткие высококачественные видеоклипы одним щелчком мыши. Оно использует передовые технологии, такие как покадровое моделирование физики, подсказки на основе движения и мультимодальный анализ, для предоставления креативного видеоконтента в доступном формате.
Этот бета-релиз знаменует начало пути развития продукта, внедряя ранние творческие возможности, призванные стимулировать генерацию идей и знаменуя начало новой эры в создании видео с использованием искусственного интеллекта.
Платформа позволяет пользователям выбирать предпочтительный стиль креативного агента, описывать свою идею простым языком без необходимости иметь какие-либо технические знания, а затем получать полностью обработанное, отточенное видео, созданное Hailuo Agent.
Hailuo Video Agent разрабатывается в три отдельных этапа. Первый этап включает готовые шаблоны видеоагентов, которые генерируют высококачественные, креативные видео из отправленного пользователем текста или изображений с помощью одной команды.
На втором этапе будут представлены полунастраиваемые видеоагенты, предоставляющие пользователям возможность изменять все аспекты процесса создания видео, включая сценарий, визуальные эффекты и закадровый голос. На третьем этапе будет представлен полностью автономный, сквозной видеоагент, способный преобразовывать творческий вклад в финальное видео с минимальным ручным вмешательством.
MiniMax заявила, что намерена постепенно внедрить второй этап инструментов создания Агента в течение лета.
Кроме того, MiniMax представила Voice Design, усовершенствованную модель преобразования текста в речь с нуля, которая использует обучаемый кодер диктора для точного воспроизведения тембра голоса-образца без необходимости транскрипции. Эта технология обеспечивает высококачественный и выразительный синтез речи, включая возможности клонирования голоса с одного раза. Она поддерживает вывод на 32 языках и предлагает сложные функции, такие как модуляция эмоций и профессиональная настройка голоса, что отражает значительный прогресс в многоязычной и адаптивной генерации голоса.
MiniMax запускает MiniMax-M1 LLM и видеомодель Hailuo 02
MiniMax — это стартап ИИ, который считается одной из ведущих новых китайских фирм ИИ. Компания специализируется на разработке крупномасштабных мультимодальных систем ИИ, охватывающих генерацию текста, голоса, изображений и видео, включая видеомодель Hailuo.
Его инфраструктура поддерживает производство миллиардов текстовых токенов и миллионов видеофрагментов. MiniMax поддерживается крупными инвесторами, такими как Alibaba, Tencent и IDG, и входит в избранную группу быстрорастущих китайских стартапов в области ИИ, часто называемых «маленькими драконами», которые в совокупности привлекли значительный венчурный капитал за последний год.
На прошлой неделе компания запустила несколько новых технологий, включая большую языковую модель (LLM) под названием MiniMax-M1, которая представлена как более эффективная, чем другие фирменные модели в Китае, и, как сообщается, превосходит производительность модели DeepSeek R1-0528 в различных тестах производительности. Кроме того, MiniMax представила новую версию своего инструмента для генерации видео, Хайло 02 , который обеспечивает собственное разрешение 1080p, улучшенное соответствие инструкциям пользователя и расширенные возможности для моделирования сложных физических сред.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
Запуск VELVETUSDT для фьючерсной и ботовой торговли
Bitget добавит PUMP/USDT для спотовой ботовой торговли
Новые спотовые маржинальные торговые пары - PUMP/USDT
Запуск PUMPUSDT для фьючерсной и ботовой торговли
Популярное
ДалееЦены на крипто
Далее








