Удаление данных эксперимента
С 30.05.2025 ст. 13.11 КоАП действует в редакции ФЗ-420 от 30.11.2024: 18 частей вместо прежних семи, оборотный штраф до 500 млн ₽ при повторной утечке. Для CTO это означает одно: данные, собранные под конкретный эксперимент и не удалённые после его завершения, становятся самостоятельным источником правового риска. Ниже — как построить процесс удаления, какие требования ФСТЭК и Приказ № 21 предъявляют к ИСПДн разных уровней защищённости, и чем обезличивание для ML отличается от уничтожения в понимании регулятора.
Что закон понимает под уничтожением данных эксперимента?
Принцип хранения «не дольше необходимого» закреплён в ст. 5 ФЗ-152: оператор обязан прекратить обработку и уничтожить ПДн при достижении цели или утрате необходимости в ней. Цель «обучение модели» или «A/B-тест» — конкретная и измеримая. Как только модель обучена и результат зафиксирован, основание для хранения сырых ПДн исчезает.
Уничтожение в понимании регулятора — это действия, после которых восстановление ПДн невозможно. Для структурированных датасетов: безвозвратное удаление файла с перезаписью или шифрованием; для баз данных — DROP TABLE с последующей очисткой WAL и резервных копий. Простое перемещение в архив или пометка «удалено» уничтожением не считается.
Обезличивание — альтернатива, но не эквивалент уничтожения. Если ML-команда хочет сохранить датасет для повторного использования, данные необходимо обезличить по одному из пяти методов, закреплённых приказом РКН (введение идентификаторов, изменение состава и семантики, декомпозиция, перемешивание, обобщение). Результат обезличивания должен исключать идентификацию субъекта без привлечения дополнительной информации. Если такая возможность сохраняется — обезличивание не достигнуто, данные остаются ПДн.
Какой уровень защищённости (УЗ) требуется для экспериментальных ИСПДн?
ПП РФ № 1119 от 01.11.2012 устанавливает четыре уровня защищённости ИСПДн в зависимости от трёх параметров: категория ПДн, тип актуальных угроз и число субъектов. Экспериментальные датасеты редко выделяются в отдельную ИСПДн — чаще они наследуют уровень производственной системы-источника.
На практике ML-команды чаще всего работают с датасетами, которые попадают в диапазон УЗ-2 или УЗ-3. УЗ-2 возникает при обработке специальных категорий ПДн (например, медицинских данных пользователей для рекомендательной системы) или биометрии при угрозах 2-го типа. УЗ-3 — наиболее типичный уровень для общих ПДн (имя, email, поведенческий профиль) в объёме свыше 100 000 записей.
Приказ ФСТЭК № 21 от 18.02.2013 определяет базовый набор мер по каждому УЗ. Для удаления данных наиболее релевантны группы: ЗНИ (защита носителей информации) и РСБ (регистрация событий безопасности). Конкретно: гарантированное уничтожение информации на машинных носителях при списании и передаче (ЗНИ.8) обязательно начиная с УЗ-4. Для УЗ-2 и УЗ-3 добавляется требование фиксации события уничтожения в журнале аудита (РСБ.1–РСБ.3).
Ваша SaaS хранит датасеты экспериментов — какой УЗ реально применим?
Определение уровня защищённости зависит от категории ПДн в датасете, типа угроз по модели нарушителя и числа субъектов. Ошибка в классификации УЗ означает неправильный набор СЗИ и неполный перечень мер по Приказу ФСТЭК № 21. Это одно из первых, что проверяет инспектор РКН при внеплановой проверке после инцидента.
Заказать аудит 152-ФЗОтветим за 2 часа · +7 (983) 510-38-76 · info@vitveteam.ru · Telegram
Как организовать удаление данных в SaaS с мультиарендной архитектурой?
В мультиарендной SaaS вопрос об операторе решается через конструкцию поручения обработки (п. 3 ст. 6 ФЗ-152): арендатор (клиент-организация) остаётся оператором своих ПДн, а SaaS-провайдер выступает лицом, осуществляющим обработку по поручению. Договор поручения обязан содержать перечень действий с ПДн и обязательство уничтожить данные по завершении договора или по требованию оператора.
При работе с экспериментальными датасетами эта цепочка усложняется: ML-команда провайдера использует данные арендатора для улучшения модели. Если такое использование не предусмотрено поручением и не получено отдельное согласие — это обработка сверх заявленной цели, что образует состав ч. 1 ст. 13.11 КоАП. При утечке подобного датасета ответственность несёт тот, кто фактически обрабатывал данные.
Что подготовить для регламента удаления экспериментальных данных
- Реестр датасетов с указанием цели, срока хранения, УЗ и ответственного за удаление
- Процедуру гарантированного уничтожения на носителях (ЗНИ.8) с журналом событий (РСБ.1–3)
- Договор поручения обработки с клиентом-оператором, включая пункт об уничтожении по окончании эксперимента
- Политику обезличивания датасетов для повторного использования в ML (5 методов по приказу РКН)
- Процедуру проверки резервных копий и WAL на предмет остаточных ПДн после удаления
Отдельный вопрос — облачная инфраструктура. Если эксперимент проводился на серверах за пределами РФ, возникает нарушение требования локализации (ч. 5 ст. 18 ФЗ-152): запись, систематизация, накопление и хранение ПДн граждан РФ обязаны осуществляться в базах на территории России. Штраф по ч. 8 ст. 13.11 КоАП — 1–6 млн ₽. Удаление данных из иностранного облака само по себе не снимает ответственность за предшествующий период хранения за рубежом.
Если у вас SaaS и ML-пайплайн работает на данных клиентов — проверьте, кто по договору несёт ответственность за удаление датасетов. Отсутствие пункта об уничтожении в соглашении поручения создаёт правовой вакуум, который регулятор заполняет составом ч. 1 или ч. 12 ст. 13.11 КоАП при инциденте.
Заказать аудит 152-ФЗЧто грозит CTO по ст. 272.1 УК РФ за данные эксперимента с 11.12.2024?
Ст. 272.1 УК РФ, введённая ФЗ-421 от 30.11.2024 и действующая с 11.12.2024, устанавливает уголовную ответственность за незаконные использование, передачу, сбор или хранение компьютерной информации, содержащей ПДн. Применительно к экспериментальным датасетам риск возникает в двух сценариях: несанкционированная передача датасета подрядчику-разработчику модели без договора поручения и хранение ПДн после истечения установленного срока при осознанном бездействии.
Технический директор является субъектом этой нормы в той мере, в которой он принимал решение о развёртывании эксперимента, формировании датасета и определении сроков хранения. Делегирование задач ML-инженерам не снимает ответственности с лица, установившего организационные правила. Суды оценивают наличие или отсутствие письменного регламента удаления как одно из доказательств умысла или его отсутствия.
Дополнительно: если датасет содержит данные объектов критической информационной инфраструктуры (КИИ по 187-ФЗ), хранение и утечка затрагивают ещё одну правовую плоскость — нарушение требований к безопасности КИИ. Это отдельный состав с отдельным субъектом расследования.
Три сценария: как ошибки в удалении данных приводят к штрафам
Сценарий 1. Датасет обучения не удалён после завершения проекта. ML-команда обучила модель на пользовательских данных, модель выкачена в продакшн, датасет «остался на S3 на всякий случай». Через полгода — утечка из этого bucket. Регулятор квалифицирует ситуацию по двум составам: ч. 1 ст. 13.11 (обработка сверх необходимости) и ч. 12 ст. 13.11 (утечка от 1 000 до 10 000 субъектов, штраф 3–5 млн ₽). Аргумент «мы забыли» не является смягчающим обстоятельством в части умысла; он влияет только на оценку повторности. Если датасет содержит специальные категории ПДн — состав переходит на ч. 16 ст. 13.11.
Сценарий 2. Обезличивание выполнено некорректно. Data scientist применил псевдонимизацию (замену имени на UUID) и счёл задачу выполненной. Эксперт РКН устанавливает, что UUID сохранён в смежной таблице и обратное сопоставление тривиально. Обезличивание не признаётся достигнутым; данные остаются ПДн; хранение без актуального основания образует ч. 1 ст. 13.11. Стратегия: применять комбинацию методов (обобщение + декомпозиция), уничтожать ключевые таблицы и фиксировать факт в журнале аудита.
Сценарий 3. Резервная копия содержит ПДн после «удаления». Оператор удалил основной датасет и уведомил регулятора. В ходе расследования инцидента обнаруживается, что последний snapshot базы данных, хранимый 90 дней, содержал те же записи. Арбитражный суд региона (практика нескольких округов, 2025–2026) расценивает это как ненадлежащее уничтожение. Стратегия: регламент удаления обязан явно охватывать резервные копии, WAL-файлы и snapshot-архивы с указанием сроков их обнуления.
Из практики DATUM. IT-компания (Уральский ФО, осень 2025) проводила A/B-тест email-рассылки на выборке ~15 000 пользователей. После окончания теста датасет не был удалён; спустя три месяца произошла утечка через незащищённый endpoint внутреннего аналитического инструмента. Компания уведомила РКН в течение 20 часов (первичное уведомление) и представила отчёт за 68 часов. Арбитражный суд региона зафиксировал нарушение ч. 1 и ч. 12 ст. 13.11 КоАП; с учётом своевременного уведомления и отсутствия повторности суд применил минимальный порог по ч. 12 — штраф в пределах 3 млн ₽. ⚠️ Конкретный номер дела и точная сумма — менеджер уточняет при публикации.
Из реестра практики. В деле АС Санкт-Петербурга и Ленинградской области (дело № А56-4733/2026, ПКР Аналитика) после хакерской атаки утекли данные около 70 000 субъектов — ФИО, должность, служебный email, телефон. Квалификация — ч. 14 ст. 13.11 КоАП (свыше 100 000 субъектов по совокупности идентификаторов). Суд применил смягчающие обстоятельства. Ключевой вывод для CTO: даже «рабочие» контакты без явно выраженного согласия на обработку создают ответственность при утечке — независимо от категории данных.
Услуги DATUM по теме
- Аудит соответствия 152-ФЗ — оценка ИСПДн, определение УЗ, проверка регламентов удаления
- DPIA (оценка воздействия) — для ML-систем с высоким риском, обработка спецкатегорий
- Комплект ОРД под ключ — регламент удаления, политика обезличивания, договор поручения
Частые вопросы
1. Какой УЗ выбрать для SaaS с экспериментальными датасетами?
Уровень защищённости определяется по ПП РФ № 1119 на основании трёх параметров: категория ПДн (специальные, биометрические, общие), тип актуальных угроз (1–3) и число субъектов (до/свыше 100 000). Экспериментальный датасет из общих ПДн более 100 000 субъектов при угрозах 2-го типа требует УЗ-3; при наличии медицинских или биометрических данных — УЗ-2 или УЗ-1. Ошибка в классификации означает неполный набор мер по Приказу ФСТЭК № 21 и нарушение, выявляемое при проверке.
2. Можно ли использовать иностранные облака для ML-экспериментов?
Нет, если речь идёт о записи, систематизации, накоплении или хранении ПДн граждан РФ. Часть 5 ст. 18 ФЗ-152 требует, чтобы эти действия выполнялись только в базах данных на территории России. Хранение датасета в AWS us-east-1 или Google Cloud EU нарушает требование локализации с момента загрузки данных. Штраф по ч. 8 ст. 13.11 КоАП — 1–6 млн ₽. Использование иностранного облака только для вычислений над обезличенными данными допустимо, если обезличивание действительно достигнуто по методам РКН.
3. Что такое обезличивание для ML и чем оно отличается от псевдонимизации?
Обезличивание по ФЗ-152 — это действия, после которых определить принадлежность данных конкретному субъекту без дополнительной информации невозможно. Псевдонимизация (замена идентификатора на суррогатный ключ) обезличиванием не является, если ключевая таблица сохранена. Приказ РКН устанавливает пять методов; для ML наиболее применимы обобщение (замена точных значений диапазонами) и декомпозиция (разделение датасета так, чтобы ни одна часть не позволяла идентификацию). Регулятор вправе проверить, достигнут ли результат обезличивания фактически.
4. Кто является оператором ПДн в мультиарендной SaaS?
Оператором остаётся клиент-организация (арендатор): она определяет цели и способы обработки ПДн своих пользователей. SaaS-провайдер выступает лицом, осуществляющим обработку по поручению (п. 3 ст. 6 ФЗ-152). Обязанности провайдера фиксируются в договоре поручения: перечень действий, требования безопасности, обязательство уничтожить данные по завершении договора. Если провайдер использует данные арендатора для собственных нужд (обучение общей модели), это требует отдельного основания — согласия или самостоятельного уведомления РКН о расширенных целях.
5. Какие СЗИ обязательны при удалении данных в ИСПДн?
Приказ ФСТЭК № 21 не содержит закрытого списка конкретных продуктов; он определяет функциональные группы мер. Для процедуры уничтожения ключевые группы — ЗНИ (гарантированное стирание носителей, ЗНИ.8) и РСБ (регистрация события удаления с указанием времени, субъекта действия и объёма данных). Конкретные СЗИ выбираются исходя из УЗ и модели угроз; при УЗ-1 и УЗ-2 применяются сертифицированные ФСТЭК средства. Операционная система без дополнительных средств гарантированного уничтожения не соответствует требованию ЗНИ.8 начиная с УЗ-3.
Итог
Удаление данных эксперимента — это не технический шаг в конце пайплайна, а юридическое обязательство, нарушение которого с 30.05.2025 стоит от 3 до 500 млн ₽ в зависимости от числа субъектов и повторности. Регламент должен охватывать основной датасет, резервные копии, WAL-файлы и журнал аудита с доказательством факта уничтожения.
DATUM сопровождает IT-компании и SaaS-провайдеров в определении УЗ по ПП РФ № 1119, разработке регламентов удаления и политик обезличивания для ML, а также в подготовке договоров поручения обработки для мультиарендных архитектур.