豆包语音合成2.0

豆包语音 2.0 专注于高效、灵活的语音生成，核心支持语音合成指令解析、历史上下文关联，并提供精细化的情感与语速控制功能。

语音合成指令解析
支持直接接收文本指令，自动识别 “生成语音” 核心需求，无需额外格式标注。（在additions参数中，例如："context_texts":["用试探性的犹豫、带点害羞又藏着温柔期待的语气说"]）
可解析指令中的隐含参数，能同步识别内容与情感需求。

历史上文关联
自定义参数关联历史语音id，根据历史场景生成语音。（在additions参数中，例如："section_id":8d539c96-7ff8-4d8d-8d75-84843def5a73）

情感控制
内置多类基础情感库，包括温柔、亲切、正式、活泼、沉稳等，满足不同场景需求。
支持通过文本指令自定义情感强度，例如 “生成语气稍活泼的语音”“用非常沉稳的语调朗读”。

语速控制
提供三级基础语速选项：慢速、正常、快速，可直接通过指令指定。
支持细粒度语速调节，例如 “语速比正常慢 20%”“每分钟 150 字的速度生成语音”，精准匹配聆听习惯。

请求参数

Header 参数

Body 参数application/json必填

示例

{
    "user": {
        "uid": "12345"
    },
    "namespace": "your_namespace",
    "req_params": {
        "text": "今天天气好好呀。",
        "ssml": "",
        "speaker": "zh_female_vv_uranus_bigtts",
        "audio_params": {
            "format": "mp3",
            "sample_rate": 24000,
            "bit_rate": 128000,
            "emotion": "happy",
            "emotion_scale": 5,
            "speech_rate": 0,
            "loudness_rate": 0,
            "enable_timestamp": true
        },
        "additions": "{\"silence_duration\":500,\"context_texts\":[\"说话慢一点\"],\"section_id\":8d539c96-7ff8-4d8d-8d75-84843def5a73}"
    }
}

请求示例代码

Shell

JavaScript

Java

Swift

PHP

Python

HTTP

Objective-C

Ruby

OCaml

Dart

application/json

Bodyapplication/json

示例

{"code":200,"data":"https://cdn.aiznt.com/audio/2025/10/21/8731cdc0-aea3-40e2-976e-36ad3aa0acce.mp3","message":"success"}

请求参数

请求示例代码

返回响应