文本转语音

Portkey 的 AI 网关目前支持 OpenAI 的 tts-1tts-1-hd 等文本转语音模型。

用法

我们遵循 OpenAI 签名,您可以将输入文本和语音选项作为 API 请求的一部分发送。所有输出格式 mp3opusaacflacpcm 都被支持。Portkey 还支持 TTS 模型的实时音频流。

以下是一个示例:

import fs from "fs";
import path from "path";
import OpenAI from "openai";
import { PORTKEY_GATEWAY_URL, createHeaders } from 'portkey-ai'

const openai = new OpenAI({
  baseURL: PORTKEY_GATEWAY_URL,
  defaultHeaders: createHeaders({
    apiKey: "PORTKEY_API_KEY",
    virtualKey: "OPENAI_VIRTUAL_KEY"
  })
});

const speechFile = path.resolve("./speech.mp3");

async function main() {
  const mp3 = await openai.audio.speech.create({
    model: "tts-1",
    voice: "alloy",
    input: "Today is a wonderful day to build something people love!",
  });
  const buffer = Buffer.from(await mp3.arrayBuffer());
  await fs.promises.writeFile(speechFile, buffer);
}

main();

完成后,请求将记录在日志 UI 中,并显示产生的费用和延迟。

支持的提供商和模型

以下提供商支持文本转语音,更多提供商将很快添加。请提交请求PR以将模型或提供商添加到AI网关。

提供商
模型

tts-1 tts-1-hd

Deepgram(即将推出)

ElevanLabs(即将推出)

Last updated