Автономные
интеллектуальные системы

Технология

On-premise ИИ для закрытого контура

Развертывание ИИ внутри инфраструктуры заказчика без передачи данных во внешние API и без зависимости от облака. Подходит для банков, госорганизаций, юридических служб и любых компаний с чувствительными данными и требованиями ИБ.

  • Данные не покидают периметр компании
  • Соответствие 152-ФЗ и внутренним политикам ИБ
  • Работа в закрытом контуре без интернета
  • Контроль и аудит со стороны ИБ-службы заказчика
  • Обновления моделей через защищенный канал

Что это

Что такое on-premise ИИ

On-premise ИИ - это развертывание моделей и сопутствующей инфраструктуры внутри периметра заказчика: на его серверах, в его сети, под управлением его ИТ-службы. В противоположность облачным сервисам, где данные и запросы передаются внешнему провайдеру, on-premise решение полностью контролируется заказчиком. ИБ-служба видит, какие данные обрабатываются, куда уходят логи, кто имеет доступ к моделям и индексам.

Для регулируемых отраслей и компаний с чувствительными данными on-premise - единственный приемлемый формат. Банковская тайна, персональные данные, коммерческая тайна, гостайна не могут быть переданы внешнему провайдеру без серьезных юридических и репутационных последствий. Локальное развертывание решает эту проблему по умолчанию: данные не уходят наружу, и доказывать это не нужно - это конструктивное свойство архитектуры.

On-premise при этом не значит «изолированная система без обновлений». Архитектура предусматривает контролируемый канал для обновлений моделей и компонентов: через защищенный репозиторий, через ручную выгрузку или через специально согласованный шлюз. Это соответствует практике большинства корпоративных систем безопасности.

Когда нужно

Когда облачный ИИ не подходит

Регуляторные ограничения

  • Персональные данные и 152-ФЗ
  • Банковская тайна и требования ЦБ
  • Гостайна и служебная тайна
  • Импортозамещение и требования к отечественным решениям

Бизнес-ограничения

  • Договорные обязательства о неразглашении
  • Коммерческая тайна и интеллектуальная собственность
  • Требования заказчиков к подрядчикам по работе с данными
  • Зависимость от стабильности внешнего провайдера

Технические ограничения

  • Закрытый контур без интернета
  • Требования к латентности и контролю
  • Необходимость интеграции с внутренними системами без выхода наружу
  • Аудит и прослеживаемость каждого запроса

Архитектура

Архитектура on-premise развертывания

Базовая архитектура состоит из четырех контуров. Контур моделей - это серверы с развернутыми LLM, эмбеддинг-моделями и классификаторами. Контур данных - векторная база, индексы и хранилища документов. Контур приложений - API, веб-интерфейсы и интеграции с СЭД, CRM, порталом. Контур ИБ - логирование, мониторинг, контроль доступа и обновлений.

Все контуры разворачиваются в инфраструктуре заказчика: на физических серверах, виртуальных машинах или контейнерах в Kubernetes. Возможна работа полностью без интернета - для этого канал обновлений выводится в отдельный сегмент, а основная сеть изолируется. Это типовая практика для систем, работающих с гостайной.

Управление обновлениями - отдельный важный сценарий. Модели публикуются и обновляются регулярно, но в закрытом контуре нельзя просто скачать новую версию из открытой сети. Поэтому организуется защищенный канал: проверенные сборки выкладываются в локальный репозиторий, проходят верификацию ИБ-службы и только потом разворачиваются в продакшене. Это требует процесса, но позволяет сохранять актуальность моделей без компромиссов по безопасности.

Безопасность

Безопасность и комплаенс

On-premise ИИ упрощает прохождение проверок ИБ, потому что использует те же механизмы, что и остальные корпоративные системы: контроль доступа через AD/LDAP, журналирование событий, мониторинг сетевого трафика, регулярные обновления. Никакой «особой» инфраструктуры не требуется, и ИБ-служба не должна разбираться в специфике облачных AI-провайдеров.

Для систем, работающих с персональными данными, важно, что оператором ПДн остается заказчик: данные не передаются третьему лицу, не нужны дополнительные соглашения о трансграничной передаче и согласия пользователей. Это снимает значительный пласт юридических вопросов и упрощает соответствие 152-ФЗ.

Отдельно прорабатывается модель угроз для самой ИИ-системы: защита от извлечения данных через prompt-инъекции, ограничения на типы запросов, контроль ответов модели. На этапе аудита мы согласовываем модель угроз с ИБ-службой заказчика и фиксируем ее в технической документации.

Часто задаваемые вопросы

Частые вопросы про on-premise ИИ

Что такое on-premise ИИ простыми словами?

Это ИИ-система, которая работает на ваших серверах, под управлением вашей ИТ-службы, и не передает данные наружу. В отличие от облачных сервисов вроде ChatGPT, где запросы уходят внешнему провайдеру, on-premise система полностью изолирована в периметре компании. Подходит для регулируемых отраслей и компаний с чувствительными данными.

Можно ли работать в полностью закрытом контуре без интернета?

Да. Модели и компоненты разворачиваются один раз через защищенный канал, после чего система работает автономно. Для обновлений организуется отдельный сегмент сети или ручная выгрузка через одноразовые носители. Это типовая практика для систем с повышенными требованиями к ИБ.

Как обновлять модели в закрытом контуре?

Через защищенный канал обновлений: проверенные сборки моделей выкладываются во внутренний репозиторий, проходят верификацию (контрольные суммы, проверка подписи, тестовая инфраструктура), и только потом разворачиваются в продакшене. Этот процесс мы согласовываем с ИБ-службой на этапе аудита и фиксируем в регламенте.

Подходит ли on-premise ИИ под требования 152-ФЗ?

Да, on-premise развертывание упрощает соответствие 152-ФЗ: данные не передаются третьему лицу, оператором ПДн остается заказчик, обработка происходит на серверах заказчика. Не нужны дополнительные согласия пользователей на трансграничную передачу и соглашения с внешними обработчиками. Конкретная архитектура согласовывается с ИБ-службой на этапе аудита.

Какая инфраструктура нужна для on-premise ИИ?

Базовый стек - серверы с CPU (для большинства корпоративных задач GPU не требуется), сетевое хранилище для документов и индексов, средства виртуализации (KVM, VMware, OpenStack) или Kubernetes. Для типовых сценариев достаточно сервера с 32–64 ГБ RAM и SSD. Расширение под нагрузку делается горизонтально.

Можно ли on-premise ИИ работать с гостайной?

Да, при условии соблюдения требований по сертификации компонентов и физической инфраструктуры. Архитектура совместима с работой в изолированной сети и аттестованных помещениях. Конкретный набор мер согласовывается с заказчиком и регулятором - это всегда индивидуальный проект.

Можно ли совместить on-premise с облачными сервисами?

В принципе да, но это уже не «чистое» on-premise решение. Гибридные схемы (часть моделей локально, часть в облаке) применяются, когда часть задач не критична по конфиденциальности, а часть - критична. Такая архитектура должна проходить дополнительный аудит ИБ, потому что граница между контурами становится уязвимым местом.

Чем on-premise ИИ отличается от self-hosted?

Термины часто используются как синонимы. «Self-hosted» больше используется в IT-сообществе для open-source решений, развернутых на собственных серверах. «On-premise» - корпоративный термин, подчеркивающий, что инфраструктура находится в собственности и под управлением заказчика. На практике это одно и то же.

Заявка

Обсудить on-premise развертывание ИИ

Расскажите про требования ИБ и инфраструктуру - вернемся с архитектурным предложением.

Что лучше приложить к заявке

  • Какие задачи и какие типы данных будут обрабатываться.
  • Какие требования ИБ и регуляторы релевантны.
  • Есть ли закрытый контур и какие правила обновлений.
  • Какая инфраструктура доступна для развертывания.