D-ID

8个月前更新 3 0 0

全球首款「静态照片 → 开口说话视频」平台,结合 GPT-3、Stable Diffusion 与自研人脸动画引擎,30 秒生成多语言数字人,广泛用于短视频、课程、客服、营销等场景。

所在地:
海外(可能无法打开)
语言:
zh
收录时间:
2025-09-20

全球首款「静态照片 → 开口说话视频」平台,结合 GPT-3、Stable Diffusion 与自研人脸动画引擎,30 秒生成多语言数字人,广泛用于短视频、课程、客服、营销等场景。

站点定位

D-ID 由以色列 D-ID 公司 2020 年推出,定位为“零拍摄、零设备”的 AI 视频生成工厂。用户只需上传一张正面照片+文本/音频,即可自动合成唇形同步、表情自然的虚拟人演讲视频;支持 API 与批量渲染,适合内容创作者、教育机构、企业营销及广电级多语本地化需求。

核心能力

  • 照片开口说话
    单张 2D 正面照即可生成 1080P60 虚拟人,唇形误差 <100 ms,支持 120+ 种语言、30+ 内置音色,亦可克隆原声。
  • 三种生成模式
    ① 文本驱动:输入文案 → 选音色 → 一键出片
    ② 音频驱动:上传 MP3/WAV,自动对齐口型与表情
    ③ 语音克隆:10 秒样本即可复刻音色,跨语种同步
  • 多场景数字人库
    提供 100+ 官方模特(正装/休闲/卡通/3D 写实),可自定义服装、背景、LOGO,亦可上传自有 IP 形象。
  • 视频尺寸自由切换
    一键输出 9:16(短视频)、16:9(横版课程)、1:1(社媒),支持绿幕背景方便二次合成。
  • 企业级批量 & API
    REST & WebSocket,≤500 ms 首包,支持 CSV 批量、SSML 标签、情绪标签、数字水印与溯源。
  • 隐私与合规
    提供面部匿名化、语音水印、GDPR/ISO 27001 认证,支持私有化部署与本地渲染。

功能分区

  1. Create Video – 快速成片
    上传照片 → 输入文本或音频 → 选语言/音色 → 生成预览 → 下载 MP4。
  2. AI Agents – 对话式数字员工
    上传知识库 → 绑定形象 → 嵌入网站或小程序,实现 7×24 多语客服。
  3. PowerPoint-到-视频
    一键导入 PPT,自动分页配旁白,虚拟人全程出镜,适合网课、企业内训。
  4. Voice Cloning – 音色工厂
    即时模式(10 s)与专业模式(30 min)双档,支持情绪标注、语速、停顿。
  5. Bulk & API – 批量中心
    CSV 导入、Webhook 回调、渲染队列管理,适合万级视频自动化。

订阅方案(美元)

版本 月费 年付优惠 权益
Free $0 5 分钟 480P,带水印,需署名
Lite $5.9 $4.9/月 10 分钟 720P,无水印,社区音色
Pro $29 $24/月 60 分钟 1080P,克隆 3 音色,优先队列
Advanced $196 $165/月 400 分钟,API,绿幕,团队空间
Enterprise 定制 白牌、本地部署、SLA、版权买断

教育邮箱享 8 折;新用户注册送 14 天 Pro 试用。

典型场景

  • 短视频起号:老者语录、禅语小和尚,3 分钟完成数字人+字幕+BGM,直接发抖音 。
  • 课程/培训:PPT 导入 → 自动分页讲解 → 1080P 成片,节省 90% 棚拍成本。
  • 多语本地化:一条英文广告 → 自动法/德/西/日配音,唇同步后投放海外社媒。
  • “复活”亲人:老照片+旧录音生成回忆视频,缓解哀思 。
  • 企业客服:AI Agent 嵌入官网,形象+知识库 7×24 答疑。

快速上手 3 步

  1. 打开 studio.d-id.com → 邮箱/Google 注册
  2. 点击 Create Video → 上传照片/选模特 → 输入文本或音频
  3. 选语言/音色 → 生成 → 下载 MP4 或复制分享链接

访问与资源

运营主体

  • 公司:D-ID(De-Identification Lab)
  • 成立:2017 年,以色列特拉维夫
  • 融资:2025 年 C 轮 2 亿美元,估值 16 亿美元
  • 合规:GDPR、ISO 27001、SOC-2,支持数字水印与溯源查验 。

数据统计

相关导航

暂无评论

none
暂无评论...