插件API介绍
首页
申请API KEY爱智特智能体发行
首页
申请API KEY爱智特智能体发行
  1. 豆包语音
  • 新手引导
    • 新手引导指南
    • 账户
      • 查询账户余额
  • 对话
    • 所有对话模型均兼容 OpenAI 格式
    • Realtime (实时语音、对话)
    • Responses API与Chat API对比
    • Chat API
      • Chat(聊天)
      • Chat(流式返回)
    • Responses API
      • 创建模型响应
      • 创建模型响应(流式返回)
      • 创建模型响应(调用联网)
  • 音频
    • Suno
      • 代理 Suno,实现 api 形式调用 Suno 文生歌
      • 音乐生成参数介绍
      • 场景一: 灵感模式
      • 场景二: 自定义.歌词歌名
      • 场景三: 纯音乐.自定义
      • 场景四: 纯音乐.灵感模式
      • 场景五: 续写自定义音频
      • 场景六: 续写音乐并获取完整音乐
      • 场景七: Cover 音乐翻版\修改风格
      • 场景八: Replace Section.替换片段
      • 场景九: Persona.歌手风格
      • 场景十: 上传续写
      • 生成音乐(灵感模式)
      • 生成音乐(固定自定义歌词模式)
      • 音轨分离
      • 查询音乐任务
      • 获取wav格式文件
      • Timing:歌词、音频时间线
      • 生成歌词
      • 批量查询任务
      • 批量查询歌曲
    • Udio
      • 生成音乐
      • 查询音乐任务
    • Minimax音乐
      • 海螺音乐
    • Minimax
      • 文字转语音
      • 声音克隆
      • 文件上传
    • MOSS-TTSD
      • MOSS-TTSD音频合成
    • IndexTTS-2
      • IndexTTS2音频合成
    • CosyVoice2
      • CosyVoice2音频合成
    • 豆包语音
      • 豆包语音合成2.0
        POST
    • 已废弃
      • 文字转音频
  • 图片
    • 即梦(豆包)
      • 即梦3.0智能绘图提交任务
      • 即梦3.0智能绘图任务查询
      • 即梦4.0(Seedream 4.0)文生图和图生图
    • Midjourney
      • 提交绘图
      • 提交图片编辑
      • 提交视频生成
      • 查询任务
      • 批量查询任务
      • 提交换脸任务
      • 提交局部重绘(前置操作)
      • 提交绘图操作动作(放大、变幻、局部重绘等)
      • 提交局部重绘
    • Nano-banana官方
      • 文生图
      • 图生图(图片修改)
      • 多图修改
    • 通用图片生成
      • 获取异步生成的图片
      • 通用图片生成(异步接口)
      • 通用图片生成(同步接口)
    • 小红书图文生成排版
      • 小红书图文生成排版
    • 通用图片编辑
      POST
    • 数据模型
      • Schemas
        • ImageGenerationResponse
        • ImageData
        • Usage
        • Error
        • ErrorResponse
  • 视频
    • 谷歌VEO
      • 文生视频
      • 图生视频
      • 视频任务查询
    • 剪映
      • 草稿合成视频
      • 合成视频状态查询
    • Runway
      • 视频生成
      • 表情迁移
      • 视频查询
    • Minimax海螺
      • 视频生成
      • 视频查询
    • Pixverse
      • 视频查询
      • 视频生成
    • 可灵
      • 任务查询
      • o1查询任务
      • o1 多模态生视频
      • 文生视频
      • 图生视频
      • 多图参考生视频
      • 视频生音效(推荐传入链接)
      • 多图参考生图
      • 视频特效
      • 文本生成音效
      • 图像生成
      • 虚拟试穿(接口端点服务不可用)
      • 视频延长(找不到已有视频id)
      • 对口型(接口端点无此渠道)
      • 扩图(开发中)
    • 即梦
      • 官方格式查询视频
      • 文生视频(官方格式)
      • 首尾帧生成视频(官方格式)
      • 多图参考生视频(官方格式)
      • 首帧生成视频(官方格式)
    • Sora2
      • 官方格式
        • 文生视频
        • 图生视频
        • 任务查询
        • Sora2编辑视频(remix)
      • 最新sora2
      • Sora2文生视频
      • Sora2图生视频
      • Sora2查询任务
    • Vidu
      • 查询任务
      • 参考图生视频
      • 文生视频
      • 图生视频
      • 首尾帧生视频
    • Wan
      • 查询任务
      • 文生视频
      • 首帧生视频
      • 首尾帧生视频
  • 数据服务
    • 小红书
      • 小红书发布助手
      • 小红书笔记详情
      • 小红书博主笔记
      • 小红书首页feed流
      • 小红书搜索
      • 任务查询
    • 抖音
      • 任务查询
      • 抖音搜索
      • 抖音视频详情
      • 抖音创作者主页
    • bilibili
      • bilibili搜索
      • bilibili视频详情
      • bilibili up主 主页
      • bilibili首页feed流
      • 任务查询
    • 网页信息获取
      • 网页Markdown格式
    • DeepSeek-OCR
      • 图片识别通用接口
    • 小红书(暂未上线)
      • 小红书热点
      • 扫码登录
      • 获取cookies
      • 小红书详情
      • 小红书作品列表
    • 抖音(暂未上线)
      • 博主作品列表
      • 抖音热点获取
      • 博主基本信息
      • 抖音作品详情
    • bilibili(暂未上线)
      • up主作品列表
      • bilibili热点获取
      • up主基本信息
      • 作品详情
  • 工作流插件
    • Dify
      • Dify工作流运行
      • Dify 工作流运行查询
    • 公众号助手
      • 获取 AccessToken
      • 上传临时图片素材(三天)
      • 上传图文消息中的图片(不保存到素材库)
      • 上传图片素材(永久)
      • 上传视频素材
      • 新建草稿
      • 获取草稿列表
      • 获取草稿详情
      • 发布草稿
      • 一键生成草稿
      • 群发文章并通知
    • 用于coze插件计费
首页
申请API KEY爱智特智能体发行
首页
申请API KEY爱智特智能体发行
  1. 豆包语音

豆包语音合成2.0

POST
/doubao_speech/v1/tts
最后修改时间:2025-10-24 05:42:32
豆包语音 2.0 专注于高效、灵活的语音生成,核心支持语音合成指令解析、历史上下文关联,并提供精细化的情感与语速控制功能。
1.
语音合成指令解析
支持直接接收文本指令,自动识别 “生成语音” 核心需求,无需额外格式标注。(在additions参数中,例如:"context_texts":["用试探性的犹豫、带点害羞又藏着温柔期待的语气说"])
可解析指令中的隐含参数,能同步识别内容与情感需求。
2.
历史上文关联
自定义参数关联历史语音id,根据历史场景生成语音。(在additions参数中,例如:"section_id":8d539c96-7ff8-4d8d-8d75-84843def5a73)
3.
情感控制
内置多类基础情感库,包括温柔、亲切、正式、活泼、沉稳等,满足不同场景需求。
支持通过文本指令自定义情感强度,例如 “生成语气稍活泼的语音”“用非常沉稳的语调朗读”。
4.
语速控制
提供三级基础语速选项:慢速、正常、快速,可直接通过指令指定。
支持细粒度语速调节,例如 “语速比正常慢 20%”“每分钟 150 字的速度生成语音”,精准匹配聆听习惯。

请求参数

Header 参数

Body 参数application/json必填

示例
{
    "user": {
        "uid": "12345"
    },
    "namespace": "your_namespace",
    "req_params": {
        "text": "今天天气好好呀。",
        "ssml": "",
        "speaker": "zh_female_vv_uranus_bigtts",
        "audio_params": {
            "format": "mp3",
            "sample_rate": 24000,
            "bit_rate": 128000,
            "emotion": "happy",
            "emotion_scale": 5,
            "speech_rate": 0,
            "loudness_rate": 0,
            "enable_timestamp": true
        },
        "additions": "{\"silence_duration\":500,\"context_texts\":[\"说话慢一点\"],\"section_id\":8d539c96-7ff8-4d8d-8d75-84843def5a73}"
    }
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.aiznt.com/doubao_speech/v1/tts' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
    "user": {
        "uid": "12345"
    },
    "namespace": "your_namespace",
    "req_params": {
        "text": "今天天气好好呀。",
        "ssml": "",
        "speaker": "zh_female_vv_uranus_bigtts",
        "audio_params": {
            "format": "mp3",
            "sample_rate": 24000,
            "bit_rate": 128000,
            "emotion": "happy",
            "emotion_scale": 5,
            "speech_rate": 0,
            "loudness_rate": 0,
            "enable_timestamp": true
        },
        "additions": "{\"silence_duration\":500,\"context_texts\":[\"说话慢一点\"],\"section_id\":8d539c96-7ff8-4d8d-8d75-84843def5a73}"
    }
}'

返回响应

🟢200成功
application/json
Body

示例
{"code":200,"data":"https://cdn.aiznt.com/audio/2025/10/21/8731cdc0-aea3-40e2-976e-36ad3aa0acce.mp3","message":"success"}
修改于 2025-10-24 05:42:32
上一页
CosyVoice2音频合成
下一页
文字转音频
Built with