全球首款「静态照片 → 开口说话视频」平台,结合 GPT-3、Stable Diffusion 与自研人脸动画引擎,30 秒生成多语言数字人,广泛用于短视频、课程、客服、营销等场景。
站点定位
D-ID 由以色列 D-ID 公司 2020 年推出,定位为“零拍摄、零设备”的 AI 视频生成工厂。用户只需上传一张正面照片+文本/音频,即可自动合成唇形同步、表情自然的虚拟人演讲视频;支持 API 与批量渲染,适合内容创作者、教育机构、企业营销及广电级多语本地化需求。
核心能力
- 照片开口说话
单张 2D 正面照即可生成 1080P60 虚拟人,唇形误差 <100 ms,支持 120+ 种语言、30+ 内置音色,亦可克隆原声。
- 三种生成模式
① 文本驱动:输入文案 → 选音色 → 一键出片
② 音频驱动:上传 MP3/WAV,自动对齐口型与表情
③ 语音克隆:10 秒样本即可复刻音色,跨语种同步
- 多场景数字人库
提供 100+ 官方模特(正装/休闲/卡通/3D 写实),可自定义服装、背景、LOGO,亦可上传自有 IP 形象。
- 视频尺寸自由切换
一键输出 9:16(短视频)、16:9(横版课程)、1:1(社媒),支持绿幕背景方便二次合成。
- 企业级批量 & API
REST & WebSocket,≤500 ms 首包,支持 CSV 批量、SSML 标签、情绪标签、数字水印与溯源。
- 隐私与合规
提供面部匿名化、语音水印、GDPR/ISO 27001 认证,支持私有化部署与本地渲染。
功能分区
- Create Video – 快速成片
上传照片 → 输入文本或音频 → 选语言/音色 → 生成预览 → 下载 MP4。
- AI Agents – 对话式数字员工
上传知识库 → 绑定形象 → 嵌入网站或小程序,实现 7×24 多语客服。
- PowerPoint-到-视频
一键导入 PPT,自动分页配旁白,虚拟人全程出镜,适合网课、企业内训。
- Voice Cloning – 音色工厂
即时模式(10 s)与专业模式(30 min)双档,支持情绪标注、语速、停顿。
- Bulk & API – 批量中心
CSV 导入、Webhook 回调、渲染队列管理,适合万级视频自动化。
订阅方案(美元)
| 版本 |
月费 |
年付优惠 |
权益 |
| Free |
$0 |
— |
5 分钟 480P,带水印,需署名 |
| Lite |
$5.9 |
$4.9/月 |
10 分钟 720P,无水印,社区音色 |
| Pro |
$29 |
$24/月 |
60 分钟 1080P,克隆 3 音色,优先队列 |
| Advanced |
$196 |
$165/月 |
400 分钟,API,绿幕,团队空间 |
| Enterprise |
定制 |
— |
白牌、本地部署、SLA、版权买断 |
教育邮箱享 8 折;新用户注册送 14 天 Pro 试用。
典型场景
- 短视频起号:老者语录、禅语小和尚,3 分钟完成数字人+字幕+BGM,直接发抖音 。
- 课程/培训:PPT 导入 → 自动分页讲解 → 1080P 成片,节省 90% 棚拍成本。
- 多语本地化:一条英文广告 → 自动法/德/西/日配音,唇同步后投放海外社媒。
- “复活”亲人:老照片+旧录音生成回忆视频,缓解哀思 。
- 企业客服:AI Agent 嵌入官网,形象+知识库 7×24 答疑。
快速上手 3 步
- 打开 studio.d-id.com → 邮箱/Google 注册
- 点击 Create Video → 上传照片/选模特 → 输入文本或音频
- 选语言/音色 → 生成 → 下载 MP4 或复制分享链接
访问与资源
运营主体
- 公司:D-ID(De-Identification Lab)
- 成立:2017 年,以色列特拉维夫
- 融资:2025 年 C 轮 2 亿美元,估值 16 亿美元
- 合规:GDPR、ISO 27001、SOC-2,支持数字水印与溯源查验 。