Отдельный URL secure.api.modelgate.ru с автодетекцией ПД
и переключением на российские модели. Основной api.modelgate.ru
продолжает работать как обычно — это не замена, а дополнение.
Один и тот же rp_… ключ. Меняется только базовый URL.
Нужен ли вам этот режим?
Большинству запросов это не нужно
Безопасный роутер тратит чуть больше денег и работает чуть медленнее. Используйте его
только когда от этого реально зависит соответствие требованиям. Иначе — обычный
api.modelgate.ru остаётся правильным выбором.
Подходит
Вы обрабатываете данные клиентов из РФ — имена, контакты, номера документов
Нужно соответствие 152-ФЗ или внутренним требованиям к локализации ПД
B2B-продукт для российских компаний, где условия запрещают передачу ПД за рубеж
Хотите дополнительный слой защиты на случай, если в запрос случайно попадёт ПД
Можно не использовать
Запросы не содержат личных данных людей — техника, код, общие вопросы
Вам важна минимальная цена и максимальная скорость
Уже фильтруете ПД на своей стороне до отправки
Используете только российские модели через обычный API — фолбэк не нужен
Чем отличаются endpoint'ы
Один ключ, два URL, разное поведение
Вы сами выбираете, на какой адрес отправить конкретный запрос. Один проект
может пользоваться обоими — обычный для общего трафика, безопасный для
запросов с ПД.
Обычный api.modelgate.ru
Безопасный secure.api.modelgate.ru
Какой ключ
любой rp_…
тот же ключ rp_… с включёнными «Российскими» провайдерами
Выбор провайдера
самый дешёвый из разрешённых
детекция ПД, при срабатывании — резервная модель РФ
Доступные модели
все модели каталога
основная — любая, резерв — только модели с РФ-провайдером
Цена
по тарифу выбранной модели
тариф модели + 10 ₽ / 1M входных токенов
Задержка
минимальная
+ время на анализ текста (обычно <200 мс)
Картинки в запросе
поддерживаются (если модель умеет)
в первой версии — нет, возвращает 415
Логи
в общих логах /logs
в общих логах + отдельный аудит-лог /smart-router/logs
Как использовать
Drop-in замена endpoint'а
OpenAI-совместимый API, тот же формат ответа. Меняется только базовый URL — никакой
новой библиотеки, никакого переписывания кода.
1
Настройте ключ
В /keys у каждого ключа есть колонка
«Безопасный роутер». Выберите уровень защиты и резервную
российскую модель — настройки применяются только к
secure-эндпоинту.
2
Поменяйте base_url в коде
В клиентской SDK — добавьте префикс secure. к
домену. Чтобы откатиться, уберите его обратно. Обычный API
в это время продолжает работать.
3
Анализ и маршрут
Запрос проверяется на наличие ПД (телефонов, email, паспортов,
ИНН, СНИЛС, карт, имён, локаций, организаций). При срабатывании
— на вашу резервную модель РФ.
4
Тот же формат ответа
Ответ полностью совместим с OpenAI Chat Completions. Стриминг,
tool calls — работает. Дополнительные заголовки
X-Smart-Router-Model, X-Smart-Router-PII
показывают, на какой модели был обработан запрос.
app.py
from openai import OpenAI
client = OpenAI(
api_key="rp_...",
base_url="https://secure.api.modelgate.ru/v1"# только это меняется
)
response = client.chat.completions.create(
model="gpt-5", # основная модель — может быть зарубежной
messages=[{"role": "user", "content": "Привет, я Иван..."}]
)
# В тексте найдено имя → запрос уйдёт на резервную модель РФ,# а ответ вернётся в обычном OpenAI-формате.
Примеры
Что роутер делает с конкретным запросом
Три типичных запроса в режиме balanced и как роутер принимает решение по каждому.
A · Чистый запрос
"Объясни, как работает HTTPS"
Детекция
ПД не обнаружено
Маршрут
основная моделькак обычно
B · Имя и телефон
"Привет, я Иван Петров, мой телефон +7 (495) 123-45-67"
Детекция
телефонимя
Маршрут
резервная модельроссийский провайдер
C · ИНН организации
"Подскажи реквизиты по ИНН 7707083893"
Детекция
ИНН
Маршрут
резервная модельроссийский провайдер
Уровни строгости
Четыре режима под разные сценарии
Выбираются у каждого ключа в /keys. Переключаются на лету, без перевыпуска ключа.
Режим
Срабатывает на
Не срабатывает на
Когда использовать
Строгийstrict
Любой найденный идентификатор: телефон, email, паспорт, ИНН, СНИЛС, картаЛюбая упомянутая сущность: имя, локация, организация
Пропускает только запросы без единого идентификатора и сущности
Максимум защиты. Готовы к ложным срабатываниям на обычной русской речи.
Сбалансированныйbalanced
Любой идентификатор (телефон, email, паспорт, ИНН, СНИЛС, карта)Имя + ещё одна сущность (локация или организация)
Только имя без контекста«Иван написал отчёт» — пройдёт на основную модель
Большинство сценариев. Ловит реальные данные людей, не придирается к именам.
Мягкийpermissive
Только структурированные идентификаторыИНН, СНИЛС, банковские карты, паспорт
Имена, адреса, организацииEmail и телефоны (по желанию — настраивается)
Команда обсуждает людей в общем виде, нужно ловить только явные идентификаторы.
Всегда на резервнуюalways_russian
Каждый запрос — детекция отключена
Ничего не пропускается на зарубежные модели
Гарантированная доставка только в РФ независимо от содержания запроса.
Детекция
Что именно мы распознаём
Восемь типов персональных данных. Структурированные идентификаторы проходят
проверку контрольной суммы — случайные наборы цифр не считаются ПД.
Телефон РФ
Российские мобильные и городские номера
Email
Адреса электронной почты
Паспорт РФ
Серия и номер паспорта гражданина РФ
ИНН
10-значный для организаций, 12-значный для физлиц
СНИЛС
Страховой номер индивидуального лицевого счёта
Банковская карта
Visa, Mastercard, МИР и другие международные системы
Имя
Имена и фамилии людей в русском тексте
Локация и организация
Города, адреса, названия компаний и учреждений
Стоимость
Прозрачное ценообразование
Платите за модель по обычному тарифу плюс небольшую надбавку за маршрутизацию.
На обычный api.modelgate.ru надбавка не распространяется.
Стоимость модели
Тариф выбранной (или резервной) модели — без изменений
обычная цена
Надбавка за маршрутизацию
Только за входные токены, выход не тарифицируется
+10 ₽ / 1M
Пример
Запрос на 5 000 входных токенов
+0,05 ₽ к стоимости
Готовы попробовать?
Откройте /keys, выберите ключ и настройте Безопасный роутер
в один клик. Чтобы переключиться — измените base_url. Чтобы откатиться — верните обратно.
Обычный API продолжает работать всё это время.