Skip to main content

Разработчики решений в области искусственного интеллекта (ИИ-решений) смогут получать доступ к государственным наборам данных (дата-сетам) через государственных операторов на основе мотивированного запроса.

Это следует из проекта концепции Минцифры, представленного во вторник на расширенном заседании Комиссии РСПП по медиаиндустрии и предпринимательству в информационной сфере. Проект внесен в аппарат правительства для согласования на уровне заинтересованных ведомств.

«Концепцией прежде всего предполагается создание государственных операторов наборов данных. Эти операторы должны определяться правительством Российской Федерации и субъектами — мы понимаем, что операторы должны быть определены не только на федеральном уровне, но в том числе и на уровне субъектов Российской Федерации» — пояснил советник генерального директора «Центра экспертизы и координации информатизации Министерства цифрового развития РФ» (ЦЭКИ) Андрей Никуличев.

Учитывая высокую стоимость создания дата-сетов — стоимость одного набора составляет не менее 1 млн рублей — формировать их планируется на заявительной основе, сказал Никуличев. «Мы должны четко знать, кому эти наборы данных нужны, каким образом они будут использоваться, какой социально-экономический эффект они будут приносить», — отметил представитель ЦЭКИ. При этом для приема заявок планируется организовать «единое окно». Состав и источники данных для набора будут определять сами операторы.

Помимо формирования наборов данных на основании запросов разработчиков, функцией операторов станет также обезличивание данных и обеспечение доступа к дата-сетам в зависимости от класса защищенности. В первый класс войдут общедоступные данные, во второй — обезличенные конфиденциальные данные (содержащие банковскую, налоговую, медицинскую и другие виды тайн), в третий — данные, содержащие гостайну (вопрос доступа к ним остается дискуссионным, признал Никуличев).

В зависимости от класса данных будет регулироваться как список допущенных к ним лиц (ко второму и третьему классу смогут получить доступ лишь аккредитованные разработчики), так и инфраструктура доступа и хранения сведений. Данные, содержащие гостайну, разработчики смогут использовать для обучения ИИ-моделей только на инфраструктуре операторов, без возможности скачивания.

Проверять результаты обезличивания данных, а также правильность отнесения к тому или иному классу чувствительности будут специальные аккредитованные центры безопасности данных.

Предполагается, в 2022-2023 годах разработчики смогут получить доступ к наборам открытых данных, в 2023 году — к обезличенным данным, к 2024 году — и к данным, содержащим гостайну.

Для реализации концепции планируется внести изменения в 149-ФЗ «Об информации, информационных технологиях и о защите информации», 152-ФЗ «О персональных данных» и 8-ФЗ «Об обеспечении доступа к информации о деятельности государственных органов и органов местного самоуправления». Порядок предоставления доступа к государственным наборам данных и перечень операторов планируется определить на уровне правительства РФ.

12 ноября, выступая в ходе конференции AI Journey, президент Владимир Путин потребовал как можно быстрее внести изменения в законодательство, чтобы обеспечить доступ российских разработчиков искусственного интеллекта, научных организаций и бизнеса к массивам обезличенных данных государства.

Источник