
keevx
开箱即用的 AI 数字人视频创作平台,分钟级生成多语言、高质量、可商用的专业视频
商汤科技推出的音频驱动数字人视频生成平台——1 张图 + 1 段音 = 会唱会说的动态角色
上传任意角色图 + 音频,秒级生成 480P-720P 唇形同步、全身/半身/多人、15 min 长镜头、支持说唱/歌剧/方言的 AI 数字人视频,在线免费试用。
| 模块 | 亮点 | 技术指标 |
|---|---|---|
| Audio2Video | 仅 4 步采样 (NFE),8×H100 推理,5 s 音频→5 s 视频 | 480P@25fps 实时比 1:1 |
| Lip-Sync | 正常语速到 Rap 级快嘴,口型误差 <1 帧 | 多语言音素对齐 |
| Singing | 京剧、Rap、美声、民谣、K-Pop 全风格通用 | 基频-口型联合优化 |
| Long Video | 注入参考图+时序延续,最长 15 min,ID 一致 | 记忆模块+滑动窗口 |
| Multi-Style | 真人/动漫/动物/素描全兼容 | 风格无关 latent 编码 |
| Multi-Lingual | 英/法/意/葡/日/韩/普通话/粤语/闽南语等 | 29 种方言覆盖 |
| Multi-Person | 多人对话、辩论、播客,顺序或同时发声 | 角色-音轨自动匹配 |
| Prompt Control | 文本指令控制手势、镜头、表情 | 骨骼+相机双轨条件 |
| 档位 | 价格 | 权益 |
|---|---|---|
| Free | ¥0 | 每日 3 次×60 s,720P,个人商用 |
| Pro | ¥49/月 | 无限次×5 min,1080P,API 优先 |
| Studio | 定制 | 15 min 长视频、多人并发、私有化部署 |






