В российской компании Smart Engines научили искусственный интеллект (ИИ) распознавать рукописное слово «шиншилла» без языкового контекста. Это снизит вероятность галлюцинации нейросети на слова, которые встречаются редко, и усовершенствует системы распознавания документов.
«Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями», — рассказали РИА «Новости» в компании.
Агентство отмечает, что слово «шиншилла» является своеобразным тестом Тьюринга для систем распознавания рукописного текста на кириллице. При неаккуратном почерке строчные формы букв «ш», «л», «и» становятся практически неразличимы.
Разработчики обучали нейросеть «Да Винчи» на 1,2 миллиона строк рукописного текста, синтезированного с равномерным распределением сочетаний букв. По словам гендиректора Smart Engines, доктора технических наук Владимира Арлазарова, нужен был метод ИИ, который умел бы читать сложные для прочтения рукописные слова, но без использования языкового контекста. Это необходимо для распознавания документов, например, паспортов или штампов о регистрации, в которых следует читать ровно то, что написано, а не то, что правильно с точки зрения языка.
Ранее сообщалось, что новый инструмент искусственного интеллекта от Google смог за два дня раскрыть, как одному виду супербактерий удается заразить все остальные. Над проблемой ученые из Имперского колледжа Лондона работали десять лет. Исследование касалось проблемы устойчивости бактерий к антибиотикам, что считается значительной угрозой для здоровья людей. Так, в 2019 году от инфекций, вызванных такими супербактериями, ушли из жизни не менее 1,27 миллиона человек.