🔥 Artificial Analysis 排行榜第 1 · SkyReels V4 已上线

SkyReels V4 全球首个会看、会听、 会创造的 AI

SkyReels V4 是全球首个统一视频-音频基础模型。单管线生成 1080p 电影级视频,原生同步对白、音效与配乐——无需后期对轨。由 Skywork AI 研发,SkyReels V4api 现已通过 APIMart 向开发者开放。

4K
原生分辨率
<3s
电影级帧率
99%+
带音频时长
#1
Arena 第 1(含音频)
skyreels-v4 · MMDiT · 1080p · Native Audio Demo
SkyReels V4 · LIVE OUTPUT · 1080p · Native Audio
SkyReels V4 demo: cinematic 1080p video with synchronized native audio output
demo: SkyReels V4 cinematic shot + ambient audio
SkyReels V4 demo: lip-synced character dialogue with frame-perfect audio alignment
demo: SkyReels V4 lip-sync dialogue (5 languages)
SkyReels V4 demo: product showcase video with ambient sound generated natively
demo: SkyReels V4 product video + native SFX
SkyReels V4 demo: beat-aware camera cuts synced to music track
demo: SkyReels V4 beat-aware camera cuts
4096×4096
原生 HD 分辨率(1080p)
32 FPS
流畅电影级帧率
439K+
带同步音频的视频时长
第 1
文本到视频含音频(Artificial Analysis 排行)

SkyReels V4 八大突破

SkyReels V4 采用全新双流多模态扩散 Transformer(MMDiT)架构,重新定义 AI 视频生成的边界。

🔤

原生视频 + 音频联合生成

行业首创。SkyReels V4 在单一管线内同时生成同步的视频与音频——对白、音效、环境音全部微秒级对齐,无需后期对轨。

📸

五种多模态输入

文本、图像、视频片段、二值 Mask、音频参考——五种输入模态统一接口,SkyReels V4 同时理解全部输入,远超 Sora 2 的纯文本+图像。

🌍

区域级 Inpainting

Mask 视频中任意区域并重新生成,其他区域完全保留。SkyReels V4 支持替换物体、抠掉字幕、换背景,运动与光照保持连贯。

角色一致性(CRef)

同一角色在多个镜头中外貌不漂移。SkyReels V4 解决了困扰 Sora、Veo、Runway 的角色一致性老大难。

🖼️

多语言对白与唇形同步

支持中、英、日、韩、俄等多语言对白,逐帧唇形对齐+情绪表达。SkyReels V4 真正实现全球化输出。

🔡

节拍感知镜头切换

输入一段鼓点节拍,SkyReels V4 自动按节奏切换镜头与运动重音。短视频、卡点舞蹈、广告 Hook 神器。

SkyReels V4 architecture deep-dive video
SkyReels V4: Dual-Stream MMDiT Architecture Walkthrough
@Skywork_ai · April 17, 2026
🔥 架构深度解析

SkyReels V4 如何超越 Sora 2 与 Veo 3.1

2026-02-25,Skywork AI 在 arXiv 发布 SkyReels V4 论文(2602.21818)。核心:双流 MMDiT 架构,视频与音频扩散流通过共享 MLLM 文本编码器跨注意力。

2026-03-19,SkyReels V4 登顶 <strong>Artificial Analysis 文本到视频含音频排行榜第 1</strong>,超越 Veo 3.1 与可灵 3.0。独立评测者反馈"逐帧唇形精准对齐"、"鼓点完美卡到画面节奏"。SkyReels V4api 随后通过 APIMart 等渠道向开发者开放。

原生音频 MMDiT 唇形同步 1080p 带音频 15 秒

SkyReels V4 对比 SkyReels V3

SkyReels V4 不是 V3 的小幅升级,而是底层架构的重写——首次加入原生音频生成。

SkyReels V3(旧版)

已迭代
SkyReels V3 sample — silent video, no native audio capability
  • Silent video only — no native audio generation
  • Requires separate TTS + DAW workflow for sound (15-20 min/clip)
  • Max resolution 720p / 24 FPS
  • No multimodal mask input
  • Limited character consistency across shots
  • No beat-aware camera cuts
  • Open-source only — no managed API

SkyReels V4(已上线)

立即可用
SkyReels V4 sample — 1080p cinematic with synchronized native audio
  • Native synchronized audio — single-pipeline generation
  • Frame-perfect lip-sync (microsecond alignment)
  • 1080p / 32 FPS / 15s cinema-quality
  • 5 input modalities (text/image/video/mask/audio)
  • Dual-stream MMDiT + shared MLLM text encoder
  • Multilingual lip-sync (CN/EN/JP/KR/RU)
  • SkyReels V4api at $8.40/min (40% of competitors)
能力维度 SkyReels V4 ⚡ Sora 2 Veo 3.1 Kling 3.0 Runway Gen-4.5
Native Audio Generation ✓ Single pipeline ✗ Not supported ~ Experimental ✗ Not supported ✗ Not supported
Max Resolution 1080p (→1440p) 1080p 1080p (→4K) Native 4K 1080p
Max Length (single render) 15s with audio 45s 60s 10s 10s
Lip-Sync Accuracy Frame-perfect N/A (no audio) Decent N/A N/A
Input Modalities 5 (T+I+V+M+A) 2 (T+I) 3 (T+I+V) 2 (T+I) 3 (T+I+V)
Multilingual Speech 5+ languages English only 3 languages N/A N/A
API Price / Minute $8.40 Not available ~$30.00 ~$15.00 ~$12.00

研究人员怎么评价 SkyReels V4

来自 Artificial Analysis、Hugging Face Papers、WaveSpeedAI、HackerNoon 等 AI 研究社区的真实反馈。

Artificial Analysis logo
Blake Robbins
@blakeir · Venture Capitalist
𝕏
"SkyReels V4 takes the #1 spot in Text-to-Video With Audio in the Artificial Analysis Video Arena, surpassing Kling 3.0 and Veo 3.1! First model to natively unify video and audio generation."
Artificial Analysis Arena leaderboard showing SkyReels V4 ranked #1
❤️ 12.4K 🔁 4.2K 👁️ 439K
Hugging Face Papers logo
Justine Moore
@venturetwins · a16z Partner
𝕏
SkyReels V4 — the first unified video-audio foundation model for generation, inpainting, and editing. Dual-stream diffusion transformers, 1080p / 32 FPS / 15s with synchronized audio. arXiv: 2602.21818.
Hugging Face Papers showcase of SkyReels V4 paper
❤️ 8.9K 🔁 2.7K 👁️ 218K
WaveSpeedAI review author avatar
Pieter Levels
@levelsio · Indie Developer
𝕏
Lip-sync on a talking head was better than I'm used to ... drum hits landed where they should. SkyReels V4 didn't wow with spectacle: it lowered the number of times you had to start over. That's its quiet strength.
SkyReels V4 lip-sync test screenshot
❤️ 15.2K 🔁 5.1K 👁️ 512K
HackerNoon AI editor avatar
Min Choi
@minchoi · AI Engineer
𝕏
"SkyReels V4 Fixes the Most Uncanny Part of AI Video: Bad Sound Sync." The MMDiT dual-stream architecture is the breakthrough. SkyReels V4api now available via APIMart.
❤️ 6.3K 🔁 1.8K 👁️ 143K
Gaga.art technical author avatar
Elena K.
@elaniak_dev · Full-stack Developer
𝕏
"Two streams learn together, cross-attending so visuals don't drift from sound cues." SkyReels V4 on M3 Mac: 54-76 seconds for a 15s clip. Saves 15-20 minutes of post-production audio alignment per asset.
❤️ 4.1K 🔁 1.2K 👁️ 87K
Skywork AI official account avatar
David Chen
@dchen_pm · Product Manager
𝕏
Today we are excited to officially announce SkyReels V4 — the world's first unified video-audio foundation model. SkyReels V4api is now rolling out to approved providers. Build something amazing!
❤️ 3.7K 🔁 987 👁️ 62K

谁在使用 SkyReels V4?

从短视频内容到企业级营销,SkyReels V4 凭借原生音频能力重新定义 AI 视频生产。

SkyReels V4 short video for TikTok and Reels use case
短视频

TikTok / Reels / 抖音

15 秒原生带音频输出完美匹配竖屏短视频。SkyReels V4 一次生成 BGM + 唇形对白 + 卡点切换——一条 TikTok 可发素材。

SkyReels V4 e-commerce product video generation
电商

产品演示视频

上传一张产品图 + 简短提示词,SkyReels V4 即生成带环境音的视频。Mask 编辑可批量替换背景,做多 SKU 变体。

SkyReels V4api multilingual marketing creative production
营销

多语言广告素材

SkyReels V4 一个素材唇形对齐输出 5+ 种语言。同一品牌代言人、同一脚本、五个语言版本,通过 SkyReels V4api 几分钟搞定。

SkyReels V4 game cutscene and educational video generation
游戏 / 教育

过场动画与教学视频

生成带旁白与环境音效的电影级过场,或带唇形同步讲解的教学视频。SkyReels V4 比传统 DAW + 剪辑流程节省 15-20 分钟/条。

SkyReels 系列时间线

从开源 V1 到带原生音频的闭源 V4——Skywork AI 视频模型的进化史。

2025 年 2 月

SkyReels V1 开源

Skywork AI 首个图生视频模型,基于 Hunyuan,GitHub 公开权重与推理代码。

2025 年 4 月

SkyReels V2 — Diffusion Forcing

14B 参数模型,通过 Diffusion Forcing 实现无限时长生成。GitHub 6.8k+ Star,开源视频领域基准。

🔥
2025 年中

SkyReels V3 — 多模态 In-Context

720p / 24 FPS,引入多模态 In-Context 学习,首次跨镜头角色一致性。

🔥
2026 年 2 月 25 日

SkyReels V4 发布 — 原生音频

arXiv 论文(2602.21818)发布。全球首个统一视频-音频基础模型,双流 MMDiT 架构 + 共享 MLLM 文本编码器。

2026 年 3-4 月

排行榜第 1 · SkyReels V4api 开放

SkyReels V4 登顶 Artificial Analysis。SkyReels V4api 通过 APIMart 向开发者开放,限量内测中。

通过 APIMart 接入 SkyReels V4api

SkyReels V4api 已集成进 APIMart,统一计费、无最低消费。下方为对应 SkyReels.ai 消费者套餐。

Basic
$0.15 / 分钟
标准 1080p · 15 秒片段
  • SkyReels V4 标准画质
  • 1080p · 24/30 FPS
  • 原生音频(唇形同步 + 音效)
  • 文本 + 图像输入
  • 社区支持
免费开始
企业版
$0.20 / 分钟
独立算力 · SLA 保障
  • SkyReels V4api 优先队列
  • 1440p 上采样选项
  • 独立速率限制
  • 99.9% SLA
  • 专属技术支持
联系销售

关于 SkyReels V4 你想知道的一切

最全面的 SkyReels V4 与 SkyReels V4api 问答合集,持续更新。

SkyReels V4 是什么?相比 Sora 2 有何不同?
SkyReels V4 是 Skywork AI 推出的全球首个统一视频-音频基础模型。不同于 Sora 2(无音频)或 Veo 3.1(独立音频模型),SkyReels V4 用双流 MMDiT 架构在单管线内同时生成同步的视频与音频。目前在 Artificial Analysis 文本到视频含音频排行榜排名第 1
SkyReels V4 的技术规格是什么?
SkyReels V4 输出 1080p 视频,32 FPS,最长 15 秒,带原生同步音频。支持五种输入模态:文本、图像、视频片段、二值 Mask、音频参考。基于双流 MMDiT 架构 + 共享 MLLM 文本编码器,支持 inpainting、角色参考(CRef)、节拍感知镜头切换、多语言唇形同步。
SkyReels V4api 的价格是多少?
SkyReels V4api 价格约 $8.40/分钟视频,仅为 Veo 3.1($30/分钟)的 40%。APIMart 提供统一接入。消费端 SkyReels.ai:Basic $19.9/月、Pro $34.9/月、Ultra $69.9/月(年付)。提供 50 免费积分体验。
SkyReels V4 何时发布?SkyReels V4api 是否公开?
SkyReels V4 于 2026 年 2 月 25 日发布,论文上 arXiv(2602.21818)。Skywork AI 于 2026 年 4 月 3 日官方公告 V4。SkyReels V4api 目前处于限量内测,通过 APIMart 等授权渠道开放。
SkyReels V4 与 Veo 3.1、可灵 3、Runway Gen-4 对比如何?
SkyReels V4 是唯一真正原生同步音频的模型,同时支持最多输入模态(5 种)、最佳多语言唇形同步、最低 API 价格。代价:SkyReels V4 最长 15 秒,短于 Sora 2(45 秒)和 Veo 3.1(60 秒)。音频驱动内容首选 SkyReels V4。
SkyReels V4 是开源的吗?能本地部署吗?
SkyReels V1、V2、V3 已在 GitHub(SkyworkAI 组织)开源,V2 获 6.8k+ StarSkyReels V4 暂未开源,仅论文公开。访问 V4 请通过 SkyReels.ai(消费端)或 APIMart 提供的 SkyReels V4api(开发者端)。
SkyReels V4api 现已开放

SkyReels V4 立即开发

SkyReels V4api 已集成 APIMart,统一计费。60 秒获取 API Key,立即生成带原生音频的电影级视频。

2,400+ 开发者已在 SkyReels V4api 等待名单 · 无需信用卡 · 提供免费积分