关于Http直接请求方式调用CosyVoice2-API(非代码)

文章目录

    • 1. 前情提要
    • 2. API调用详解
      • 1. 音频合成接口
        • 请求地址
        • 参数说明
        • 参数示例
        • 结果说明
        • 结果示例
        • 可能会遇到的问题
      • 2. 获取操作步骤
        • 请求地址
        • 参数说明
        • 参数示例
        • 结果说明
        • 结果示例
      • 3. 获取推理种子
        • 请求地址
        • 参数说明
        • 参数示例
        • 结果说明
        • 结果示例

1. 前情提要

  1. 系统版本:Ubuntu22.04.1
  2. 版本:CosyVoice2-2024/12
  3. python环境:miniconda3 > python3.10

注:

  1. CosyVoice2的本地安装部署文档参考
  2. 所有的接口请求前缀以实际部署请求接口为准,本示例参考官方文档端口用50000

关于Http直接请求方式调用CosyVoice2-API(非代码)_第1张图片
注意一点:点击切换[选择推理模式]里的推理模式,会有不同的[操作步骤]以及可能会提醒你使用对应的推理模型。要根据你所选的推理模式查看对应操作步骤,再去传对应的参数。

2. API调用详解

注意注意注意: 每个接口都是分成两次请求,第一次POST请求,得到$event_id后带入同地址的第二次GET请求可得音频下载地址
新版与旧版相比,地址有变化,返回参数和结果也有调整,看一下注释说明。

1. 音频合成接口

请求地址

旧版:

  1. 第一次:POST :/call/generate_audio/
  2. 第二次:GET:/call/generate_audio/$event_id

新版:

  1. 第一次:POST:/gradio_api/call/generate_audio
  2. 第二次:GET:/gradio_api/call/generate_audio/$event_id
参数说明

POST请求参数说明:

参数 类型 必填 示例 备注
Headers 头部参数
content-type String application/json 内容格式
PayLoad
data Array 数组存放10个参数
— [0] String 我是生成式语音大模型 待转写文本内容
— [1] String 预训练音色 推理模式
预训练音色
3s极速复刻
跨语种复刻
自然语言控制
— [2] String 中文女 预训练音色
— [3] String 根据操作步骤确定是否必填 prompt文本
— [4] String 根据操作步骤确定是否必填 {“path”:“http://xxx/test.wav”} prompt 上传音频,path指向在线访问地址即可
— [5] String 根据操作步骤确定是否必填 格式同[4] prompt录音音频
— [6] String 根据操作步骤确定是否必填 instruct文本
— [7] number 0 推理种子
— [8] String false 是否流式推送
— [9] number 1 速度调节(仅支持非流式推理模式下的设置)
参数示例

POST请求参数示例

{
   
   
    "data": [<

你可能感兴趣的:(AIGC,http)