Как в России развиваются технологии распознавания на основе ИИ

Эксперт Иван Котов рассуждает о статусе кво, перспективах развития, вызовах и возможных результатах применения технологии в ближайшем будущем

Как в России развиваются технологии распознавания на основе ИИ

Видеоаналитика уже присутствует в нашей жизни: автомобилисты не могут игнорировать камеры контроля, которыми «усеяны» дороги.  Обыватели видят систему видеонаблюдения каждый раз, когда входят в подъезд собственного дома. Регулярно появляются новости о том, что в том или ином городе благодаря системе видеонаблюдения и технологии распознавания лиц удалось поймать преступника.

Все это — результат активного развития технологий распознавания и аналитики видео. Сегодня на этом рынке в России активно работают несколько компаний. 

Пул лидеров

Пожалуй, один из крупнейших игроков и технологических лидеров — российская компания VisionLabs, которая предлагает несколько решений, уверенно распознающих и лица людей, и объекты, в том числе животных. Стоит отметить, что перспективные разработки компании подчинены концепции человекоцентричности: VisionLabs нацелена на скелетную аналитику, стремится учить свои системы распознавать не только лица и силуэты, но и движения человека. 

Еще один заметный игрок на рынке распознавания видео — Центр речевых технологий (ЦРТ). Направление компьютерного зрения здесь развивается сравнительно недавно, около пары лет, но компания уже выпустила на рынок оригинальное решение для распознавания лиц

Известный игрок рынка и NtechLab. Именно эта компания разработала и развивает городскую систему видеонаблюдения и распознавания лиц для Москвы. NtechLab получила и международное признание: в 2021 году ее алгоритм распознавания лиц был признан лучшим в мире. 

Одним из ведущих разработчиков и производителей решений в области биометрической идентификации является компания РекФэйсис. Ее продукт помогает выполнять различные задачи бизнеса, а применение биометрии позволяет предложить более технологичные сервисы. Решение компании аттестовано для работы в соответствии с новым законом о работе с биометрическими персональными данными, ФЗ-572.

На российском рынке работают и несколько иностранных компаний. К примеру, продукты итальянской AI Tech уверенно распознают объекты, хорошие результаты распознавания демонстрируют разработки компании Herta. Но в России их продукты распространены весьма фрагментарно, в первую очередь, в связи с серьезными успехами в области распознавания видео, которых добились отечественные вендоры.

Где востребована видеоаналитика

Развитию технологий видеораспознавания немало способствует стабильно растущий спрос на подобные продукты. Они востребованы в промышленности, транспортной сфере, финансовом секторе, ритейле и логистике. Спектр применения технологий распознавания весьма широк и совсем не ограничивается распознаванием лиц. Подобные решения используются для контроля технологических процессов, действий сотрудников, отслеживания перемещения грузов, контроля соблюдения норм безопасности. 

Хорошо известен пример московского метрополитена, где на многих станциях проезд можно «оплатить лицом» с помощью технологии Face Pay. Вероятно, в обозримом будущем видеораспознавание позволит вообще отказаться от турникетов, перейдя к использованию системы оплаты проезда по модели freeflow — примерно так, как сегодня взимается плата за проезд по некоторым автомобильным магистралям. 

Потенциальная сфера использования технологий видеораспознавания — здравоохранение. Развитие поведенческой и скелетной аналитики позволит использовать решения для контроля за безопасностью общественных пространств, предотвращения конфликтов, детекции использования запрещенных предметов и даже определения эмоционального состояния людей. 

Кроме того, стоит помнить и о технологиях ближайшего будущего, в первую очередь — о нейроморфных процессорах (NPU). Они анализируют изображения гораздо быстрее и подробнее, обрабатывают десятки тысяч параметров одновременно, и это делает возможным глубокий и всесторонний анализ видео, который пока недоступен на современных процессорах. 

К примеру, NPU могут понимать, что на видео человек, распознав в кадре всего лишь ботинок или голеностоп, — ранее для этого необходимо было проанализировать минимум 25% картинки. 

Обработка только 10% изображения позволит нейропроцессору определить в кадре животное, причем с указанием конкретного вида иди даже породы. Определение мелких деталей, предметов, царапин и потертостей тоже станет возможным с появлением NPU, и такие данные помогут перейти к гораздо более глубокой аналитике видео как в статике, так и в динамике. 

Потенциал искусственного интеллекта настолько велик, что спектр применения систем распознавания видео в будущем будет ограничен не столько возможностями технологий, сколько богатством фантазии продуктологов.

Проблемы и их решения

Не стоит полагать, что бизнес в сфере систем видеоаналитики лишен проблем. Вендоры здесь сталкиваются с множеством сложностей, и не только технологических, но и организационных.

Основная проблема — доступность аппаратных технологий. Ими располагают крупнейшие мировые компании, такие как Google или IBM. В России необходимую базу имеют Сбер, который в свое время приобрел ЦРТ, МТС, поглотившая VisionLabs, и Яндекс, который активно развивает свои продукты видеоаналитики и системы беспилотного транспорта. 

Помимо технологических существует еще масса проблем, которые мешают развитию видеоаналитики. Это — и кадровый дефицит, и несовершенное законодательство, и работа регулятора. К примеру, те самые продуктологи, которые должны разрабатывать модели применения аналитических решений — «штучный товар» на рынке труда. Традиционно не хватает программистов и разработчиков. Регуляторы могут помочь преодолеть кадровый дефицит, привлекая к решению этой задачи и бизнес. 

К слову, это характерно не только для России: специалисты, которые глубоко понимают принципы работы с нейросетями, программно-аппаратными платформами, владеющие навыками тонкой настройки систем распознавания видео и анализа данных, нужны повсюду. 

Достаточно остро стоит вопрос об этичности использования видеоаналитики в целом ряде задач, когда такие системы могут вступать в противоречие с неприкосновенностью частной жизни. Поэтому необходима разработка законодательной базы, в которой будут четко определяться и права личности, и уровень ответственности всех участников процесса, от разработчиков и производителей до конечных пользователей решений. 

К примеру, весьма чувствительной проблемой является распознавание лиц и радужной оболочки глаза, поскольку эти данные весьма критичны и их несанкционированное использование может привести к серьезным проблемам. А переход от прямого распознавания лиц к анализу силуэта или скелетной аналитике позволит довести точность идентификации человека до 80% с исключением прямой персонализации. 

В связи с этим весьма важны государственные инициативы в области регулирования применения систем видеоаналитики. Они уже реализуются принятым в декабре 2022 года законом ФЗ-572 «Об осуществлении идентификации и (или) аутентификации физических лиц с использованием биометрических персональных данных».

Роль государства в развитии видеоаналитики — не только регуляторная. Известно, что на уровне правительства прорабатывается вопрос об инвестициях в разработку нейроморфных процессоров. В любом случае, для развития технологий видеоаналитики в масштабах страны необходим комплексный подход и участие всех заинтересованных сторон. 

Данные о правообладателе фото и видеоматериалов взяты с сайта «РБК Компании», подробнее в Правилах сервиса
Анализ
×
Котов Иван
Google
Сфера деятельности:Образование и наука
228
ПАО СБЕРБАНК
Сфера деятельности:Финансы
840
ПАО "МТС"
Сфера деятельности:Связь и ИТ
382
ООО "ЯНДЕКС"
Сфера деятельности:Связь и ИТ
429
ООО "ВижнЛабс"
Сфера деятельности:Связь и ИТ
3