Текст в речь

POST /v1/audio/speech

Синтез речи (Text-to-Speech) из текста. Поддерживаются форматы MP3, WAV, FLAC.

Параметры

ПараметрТипОписание
model *stringID модели, например kokoro-82m
input *stringТекст для озвучивания
voice *stringГолос: af_heart, bf_emma и др.
response_formatstringmp3, wav, flac
speedfloatСкорость (0.25-4.0)
from openai import OpenAI

client = OpenAI(
    api_key="rp_ваш_api_ключ",
    base_url="https://api.modelgate.ru/v1"
)

with client.audio.speech.with_streaming_response.create(
    model="kokoro-82m",
    input="Привет, мир!",
    voice="af_heart",
    response_format="mp3"
) as response:
    response.stream_to_file("speech.mp3")
import OpenAI from 'openai';
import fs from 'fs';

const client = new OpenAI({
    apiKey: 'rp_ваш_api_ключ',
    baseURL: 'https://api.modelgate.ru/v1',
});

const response = await client.audio.speech.create({
    model: 'kokoro-82m',
    input: 'Привет, мир!',
    voice: 'af_heart',
    response_format: 'mp3',
});

const buffer = Buffer.from(await response.arrayBuffer());
fs.writeFileSync('speech.mp3', buffer);
curl -X POST https://api.modelgate.ru/v1/audio/speech \
  -H "Authorization: Bearer rp_ваш_api_ключ" \
  -H "Content-Type: application/json" \
  -d '{"model": "kokoro-82m", "input": "Привет, мир!", "voice": "af_heart"}' \
  --output speech.mp3

Доступные модели

Полный список моделей доступен на странице моделей.