Основным источником данных для обучения искусственного интеллекта к 2028 г. станут синтетические данные (60% от общего объема) и данные с IoT-датчиков (27%). Больше трети данных будут генерироваться при помощи облачных вычислений. При этом именно бизнес и государство будут выступать основным производителем данных, а не население.
Партнер группы компаний "Б1" Сергей Салов на визионерском вечере Ассоциации больших данных (АБД) рассказал о драйверах роста рынка больших данных в перспективе до 2028 г., опираясь на данные Gartner. Согласно прогнозу аналитиков, больших данных будет больше - объем данных генерируется и обрабатывается с ежегодным приростом в 20%.
"Основным источником роста больших данных станут прежде всего синтетические данные. Они станут основным топливом для создания технологий искусственного интеллекта. Доля синтетических данных в общем объеме данных, используемых для обучения ИИ, составит 60% к 2028 г.", - рассказал Сергей Салов.
По его словам, другим важным источником новых данных станут датчики, которые работают на основе интернета вещей: доля полученных оттуда данных вырастет до 27% к 2028 г.
"Облачные технологии станут все более критичными с точки зрения как хранения и работы с данными, так и их генерации. Около 70% глобальных компаний будут использовать облачные технологии для работы с большими данными, и около 37% всех данных будут генерироваться и обрабатываться в облаках. Это рост с 20,5% в 2023 г. до 37% к 2028 г.", - рассказал Сергей Салов.
По его словам, главный тренд заключается в том, что основным источником новых данных будут не люди с их персональными данными (ПД), а бизнес и государство: доля данных, генерируемых ими, составит более 80%, а темпы роста объема этих данных будут в три раза выше, чем данных, генерируемых населением.
Основатель компании Privacy Advocates Алексей Мунтян, рассуждая о будущем персональных данных в России, отметил, что персональные данные будут обрабатывать и хранить только имеющие соответствующие компетенции компании, чтобы количество утечек уменьшилось: "В ближайшие годы мы столкнемся с концентраций ПД - это могут быть отдельные организации, ассоциации, конгломераты. Им будет доверять государство хранить данные и обрабатывать персональные и иные категории данных в тех сценариях и с тем уровнем коммерциализации, которые эти компании захотят. Всем остальным игрокам государство, скорее всего, будет снижать возможность обрабатывать ПД".
По словам Алексея Мунтяна, государству будет выгодна такая централизация еще потому, что проще запросить данные не у 7 млн операторов ПД, а всего лишь у нескольких крупных компаний.
Президент Ассоциации больших данных Анна Серебряникова, подводя итоги пятилетней работы ассоциации и намечая планы, отметила, что одним из направлений работы АБД может стать создание биржи синтетических данных на уровне стран БРИКС.