Речь в текст

POST /v1/audio/transcriptions

Распознавание речи (Speech-to-Text) из аудиофайлов. Поддерживаются MP3, WAV, M4A, OGG и другие форматы.

Параметры

ПараметрТипОписание
file *fileАудиофайл (до 25 МБ)
model *stringID модели, например whisper-large-v3
languagestringКод языка (ru, en и др.)
from openai import OpenAI

client = OpenAI(
    api_key="rp_ваш_api_ключ",
    base_url="https://api.modelgate.ru/v1"
)

with open("audio.mp3", "rb") as audio_file:
    transcript = client.audio.transcriptions.create(
        model="whisper-large-v3",
        file=audio_file,
        language="ru"
    )

print(transcript.text)
import OpenAI from 'openai';
import fs from 'fs';

const client = new OpenAI({
    apiKey: 'rp_ваш_api_ключ',
    baseURL: 'https://api.modelgate.ru/v1',
});

const transcript = await client.audio.transcriptions.create({
    model: 'whisper-large-v3',
    file: fs.createReadStream('audio.mp3'),
    language: 'ru',
});

console.log(transcript.text);
curl -X POST https://api.modelgate.ru/v1/audio/transcriptions \
  -H "Authorization: Bearer rp_ваш_api_ключ" \
  -F "file=@audio.mp3" \
  -F "model=whisper-large-v3" \
  -F "language=ru"

Доступные модели

Полный список моделей доступен на странице моделей.