Речь в текст
POST
/v1/audio/transcriptions
Распознавание речи (Speech-to-Text) из аудиофайлов. Поддерживаются MP3, WAV, M4A, OGG и другие форматы.
Параметры
| Параметр | Тип | Описание |
|---|---|---|
file * | file | Аудиофайл (до 25 МБ) |
model * | string | ID модели, например whisper-large-v3 |
language | string | Код языка (ru, en и др.) |
from openai import OpenAI
client = OpenAI(
api_key="rp_ваш_api_ключ",
base_url="https://api.modelgate.ru/v1"
)
with open("audio.mp3", "rb") as audio_file:
transcript = client.audio.transcriptions.create(
model="whisper-large-v3",
file=audio_file,
language="ru"
)
print(transcript.text)
import OpenAI from 'openai';
import fs from 'fs';
const client = new OpenAI({
apiKey: 'rp_ваш_api_ключ',
baseURL: 'https://api.modelgate.ru/v1',
});
const transcript = await client.audio.transcriptions.create({
model: 'whisper-large-v3',
file: fs.createReadStream('audio.mp3'),
language: 'ru',
});
console.log(transcript.text);
curl -X POST https://api.modelgate.ru/v1/audio/transcriptions \
-H "Authorization: Bearer rp_ваш_api_ключ" \
-F "file=@audio.mp3" \
-F "model=whisper-large-v3" \
-F "language=ru"
Доступные модели
Полный список моделей доступен на странице моделей.