选择你喜欢的标签
我们会为你匹配适合你的网址导航

    确认 跳过

    跳过将删除所有初始化信息

    您的位置:0XUCN > 资讯 > 智能
    新闻分类

    Grok Imagine Video 1.5 – xAI 推出的图生视频模型

    智能 PRO 稿源:AI工具集 2026-06-20 13:39

    Grok Imagine Video 1.5是什么

    Grok Imagine Video 1.5 是 xAI 推出的图生视频模型,模型基于 Aurora 自回归引擎构建。模型支持静态图一键生成带原生同步音频的短视频,最高 720p 分辨率,Fast 模式下生成 6 秒视频仅需约 25 秒。模型在 Arena.ai 图生视频榜单中排名第一,通过 xAI API 按秒计费提供。

    Grok Imagine Video 1.5的主要功能

    • 图生视频动画:上传单张静态图片并输入自然语言提示,模型即可生成动态视频,精准保留原图细节、光影与构图。

    • 文生视频生成:支持纯文本提示直接生成短视频,适用于快速概念探索与创意草稿。

    • 原生同步音频:在单通道生成中同步输出视频与音频,包括环境音效、背景音乐及唇同步对话,无需后期配音。

    • 视频延展续写:基于自回归机制,从现有视频的最后一帧继续生成后续片段,支持将多段短镜头串联为更长场景。

    • 多比例多分辨率输出:支持 1:1、16:9、9:16 等 7 种宽高比,可选 480p 或 720p 分辨率,最长 15 秒。

    Grok Imagine Video 1.5的技术原理

    • Aurora 自回归引擎架构:基于 xAI 自研的 Aurora 自回归视频生成引擎,通过逐帧预测生成视频序列,支持从最后一帧自回归延展后续内容,保证画面运动的时间连贯性。

    • 原生音视频联合建模:在单一前向传播中同时生成视频帧与音频波形,通过共享潜空间对齐口型、动作与音效的时间戳,实现唇同步对话与环境音效的精准匹配。

    • 物理真实感增强:优化运动连贯性与重量感模拟算法,明显减少人物肢体扭曲和物体漂浮假象,使衣摆自然晃动、下落物体加速轨迹等更接近真实物理世界。

    如何使用Grok Imagine Video 1.5

    • 获取 API 权限:访问 xAI 开发者平台注册账号并获取 API Key,当前模型 ID 为 grok-imagine-video-1.5。

    • 构造请求参数:通过 xAI API 发送请求,设置操作类型、输入模式、分辨率(480p/720p)、时长及宽高比。

    • 提交生成任务:上传起始图片或输入文本提示,描述镜头运动、动态节奏与音频需求,模型用异步方式返回视频结果。

    • 启用 Fast 模式:选择 Fast 版本加速生成,6 秒 720p 视频仅需约 25 秒,较前代 40 秒以上大幅缩短。

    • 后期延展与筛选:对生成片段进行质量审核,利用视频延展功能从最后一帧继续生成,串联多段内容形成完整叙事。

    Grok Imagine Video 1.5的核心优势

    • 图生视频榜单第一:在 Arena.ai 图像转视频评测中登顶,Elo 评分约 1330,较前代提升 52 分,综合表现领先主流竞品。

    • 生成速度大幅提升:Fast 模式下 6 秒 720p 视频仅需约 25 秒,较前代 40 秒以上缩短近 40%,适合高频创意草稿与社交内容快速迭代。

    • 音画同步精准自然:原生生成同步音频,语音清晰度与口型同步效果大幅提升,实测咀嚼声、马蹄声均能与画面动作精准对齐。

    • 物理真实感强:增强运动连贯性与重量感模拟,人物走路时衣摆自然晃动、下落物体轨迹真实,整体观感接近真实物理世界。

    Grok Imagine Video 1.5的项目地址

    • 项目官网:https://x.ai/news/grok-imagine-video-1-5

    Grok Imagine Video 1.5的同类竞品对比

    对比维度Grok Imagine Video 1.5Seedance 2.0
    最高分辨率720p1080p
    最长时长15 秒20 秒
    原生音频✅ 音效+环境音+唇同步✅ 对话强
    图生视频排名Arena 第 1
    生成速度6 秒 720p 约 25 秒
    物理模拟增强重量感与动量
    计费方式按秒计费积分/订阅

    Grok Imagine Video 1.5的应用场景

    • 社交短视频快速迭代:适合 TikTok、Instagram Reels 等平台的 6–15 秒创意短片、Meme 动画与趋势内容的高频生成。

    • 产品动态广告:将电商产品静态图转化为带镜头运动与背景音效的短视频预告,用于商品详情页与广告投放。

    • 角色口播与解说内容:上传人物肖像并输入台词,生成唇同步对话短片,适用于社交媒体口播、虚拟客服与知识类短视频。

    • 故事板动态预览:将电影或广告分镜关键帧转化为动态镜头,帮助导演与制片人在正式拍摄前快速验证视觉节奏与运镜方案。

    • 概念变体与 A/B 测试:广告团队可基于同一产品图快速生成多版本动态素材,用于测试不同视觉风格与动效的转化效果。

    超好看的资讯你懂得 >>> 点击进入

    0XU.CN

    [超站]友情链接:

    四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
    关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/

    图库
    公众号 关注网络尖刀微信公众号
    随时掌握互联网精彩
    赞助链接
    热门AI排行
    排名 热点 热门指数