ЖИЗНЬ – НЕ КИНО! РЕВОЛЮЦИОННЫЕ РЕШЕНИЯ SMILART ПО ИДЕНТИФИКАЦИИ ЧЕЛОВЕКА

Демонстрировать работающую систему идентификации человека по его изображению в наши дни очень трудно – слишком высоки ожидания. В бесчисленных фильмах и сериалах безответственные сценаристы наделили компьютеры сверхвозможностями, которые позволяют  им выхватывать кусочек уха (или, скажем, носа) человека, находящегося за километр от камеры, и по нему (в реальном времени, не иначе)  проводить  с неизменным успехом поиск по базам данных, содержащим сотни миллионов изображений. На фоне таких «успехов» даже самые серьёзные достижения реальных технологий кажутся, мягко говоря, малоубедительными.

 

Между тем, прогресс не стоит на месте. Каждый год появляются всё более и более эффективные системы, которые облегчают жизнь людям, занятым обеспечением безопасности, защитой жизни людей, а также профессионалам в других областях. Но чтобы понять этот прогресс и оценить его по достоинству, нужно хотя бы немного вникнуть в особенности того, что же делают системы идентификации человека по изображению.

 

Хорошие парни против плохих парней

Все системы делятся на две большие категории, специалисты в нашей стране называют их «кооперативные» и «некооперативные» (на западе они называются, соответственно, «for good guys» и «for bad guys»).

 

В кооперативной системе человек заинтересован, чтобы система его опознала (например, для того, чтобы получить доступ в охраняемое помещение, к защищённому компьютеру и т.п.), и он готов с системой сотрудничать. В чём заключается сотрудничество? Во-первых, человек готов к тому, чтобы быть представленным системе заранее. Это так называемый процесс ознакомления, обучения. В зависимости от целей и специфики работы системы, создаётся от двух до десяти изображений человека, которые обрабатываются и заносятся в его учётную карточку. Во-вторых, в кооперативной системе человек готов совершать шаги, ведущие к улучшению вероятности его распознавания – то есть он готов остановиться в нужном месте, смотреть в камеру, а не прятать глаза, не заматывать лицо шарфом и т.п. В-третьих, в кооперативных системах практически всегда идеальная освещённость. Вероятность распознавания в таких системах на сегодня приближается к 97%. Это лучше, чем способности среднего человека.

 

Некооперативные системы призваны узнавать людей в ситуациях, когда те не горят желанием быть опознанными. Типичная ситуация – уличная камера, снимающая поток людей, или камера в метро, на вокзале и т.п. местах, где количество людей огромно, возможности остановить их нет, освещение ужасно (либо света очень мало, либо слишком много,  тени, контрастность, шумы), а шаблон сравнения – одна «паспортная» фотография, переданная по факсу. В описанной ситуации узнать кого бы то ни было практически невозможно, что бы нам ни показывали по телевизору и в кино. В общем же случае, разумные ожидания от качества идентификации в таких системах – в пределах 70%.

 

Свет, свет, свет

Основные шаги, предпринимаемые для улучшения вероятности распознавания – в первую очередь, улучшение освещённости. Любой, кто интересовался фотографией, знает, что много рассеянного света – залог успеха. Когда вокруг светло, можно выставить оптимальную диафрагму, которая даст значительную глубину резкости, что позволит получать чёткое изображение на требуемом участке кадра. При этом слишком длинная экспозиция приводит к получению «смазанных» кадров. Для уменьшения времени экспозиции, опять же, требуется хорошая освещённость. А ещё есть тяжёлое наследие XX века – так называемые «лампы дневного света», которые мерцают 50 раз в секунду, что вступает в конфликт с временем экспозиции и приводит к появлению полос в кадре, которые тоже, мягко говоря, не помогают качеству идентификации. Шаги, предпринимаемые для решения этой проблемы – увеличение количества источников света, их мощности, применение в «лампах дневного света» так называемых «балластов», обеспечивающих частоту мерцания 1100Гц и выше.

 

Мегапиксели, углы обзора, метры

Ещё одно тиражируемое фильмами и сериалами заблуждение – возможность идентификации человека с «общего плана» камеры наружного наблюдения. Вот нам показали улицу, от края до края, вот из-за дома вышел человек, и – бац! – компьютер его узнал. Так, конечно, не бывает, хотя бы из-за ограниченного разрешения видеокамер. Вообще, описанная ситуация – пожалуй, единственная, где «гонка мегапикселей» всё ещё не завершена. В бытовых (и даже профессиональных) фото- и видеокамерах количество мегапикселей, как в том анекдоте про мощность двигателя Роллс-Ройса, «достаточное».

 

В промышленных же камерах наблюдения даже современные 10 мегапикселей – ничтожно мало. Для уверенной идентификации по изображению системам требуется не менее 90 пикселей между зрачками (в некоторых источниках пишут про 40, но работающих систем с такими параметрами до сих пор не продемонстрировано). Возвращаясь к базовым знаниям фотографии, можно легко сформулировать потребность системы в мегапикселях, отталкиваясь от трёх переменных: расстояние до объекта, угол обзора выбранного объектива (зависит от его фокусного расстояния), количество мегапикселей в матрице камеры. Если нужно покрыть коридор, по которому физически не может пройти больше двух человек одновременно, требуется одна конфигурация. Чтобы покрыть тротуар, по которому рядом может идти 10 человек, нужно совсем другое оборудование.

 

В компании «Простые решения» (торговая марка Smilart) построили простую формулу, из которой ясна зависимость между углом обзора, дальностью до объекта и количеством мегапикселей для уверенной идентификации человека по его изображению:

Найти лицо

Для того, чтобы по фото- (или видео-) изображению идентифицировать человека, сначала необходимо найти его лицо в кадре. Задача эта гораздо сложнее, чем представляется интуитивно. Во-первых, подчас человек «видит» лица даже в объектах неживой природы (на сервисе flicks даже есть группа, где коллекционируют такие «природные лица»). Во-вторых, мало найти нечто, похожее на лицо, нужно ещё расставить на этом «лице» точки, от которых будет отталкиваться алгоритм идентификации. Эти задачи решаются разными методами. Две основных группы методов можно условно назвать статистическими и эвристическими.

 

Статистические методы, как следует из названия, оперируют огромными массивами заранее обработанной информации. Если мы «показали» компьютеру, где именно находятся лица на, скажем, миллионе реальных изображений, он может «научиться» находить лица где угодно. Затем по полученному «результату» производится попытка расстановки ключевых точек.

 

Эвристические методы, напротив, работают по принципу «натягивания смайлика» – отталкиваясь от сильно упрощённой идеи (овал лица, глаза, нос, брови, уши, а также их допустимые взаимные расположения), такие алгоритмы пытаются «нарисовать» или «натянуть» требуемый «смайлик» на элемент изображения. Если это получается, результат считается лицом (и ключевые точки сразу же считаются расставленными).

Нельзя сказать, что один метод лучше другого. В разных ситуациях, на разных задачах они работают по-разному. Часто их используют в связке.

 

Узнать друга, отличить врага

Наконец, мы подходим к области идентификации. Здесь прямых ответов на простые вопросы уже нет: не существует ни одного алгоритма идентификации «коммерческого качества» (а их в мире, кстати, считанные единицы), чьи коды были бы опубликованы. Поэтому достоверно можно только рассуждать о разных подходах к идентификации. Если отбросить так называемые «нейронные сети» (там успехи в идентификации, скорее на бумаге и в головах учёных), остаются алгоритмы, которые, отталкиваясь от опорных точек, расставленных на изображении лица при его детектировании (нахождении), «натягивают сетку» и вычисляют разнообразные функции либо в точках пересечения линий, либо в точках, выбранных по какому-то другому принципу. Результатом этих манипуляций становится число (или группа чисел), которые принято называть «шаблоном идентификации». Эти шаблоны и хранятся в памяти систем. Их и сравнивают алгоритмы идентификации – кто быстрее и лучше, кто медленнее и хуже.

 

Зачем это всё?

Описанные принципы и созданные на их базе алгоритмы находят всё большее применение в повседневной жизни. Помимо «страшилок» про «большого брата», системы идентификации помогают ловить преступников, находящихся в розыске, обеспечивают контроль доступа, предотвращают мошенничество.

 

Компания «Простые решения» в течение шести лет разрабатывала собственные алгоритмы идентификации человека по изображению. Получившиеся в результате системы используются в целом ряде продуктов, призванных улучшить нашу жизнь.

 

КПП/Поток – основной продукт компании Smilart. Как следует из названия, он позволяет обеспечивать работу как систем контроля доступа (СКУД), так и розыскных систем. Топовые конфигурации позволяют идентифицировать десятки лиц в секунду и масштабируются бесконечно путём построения кластеров. Используется в метрополитене, на железной дороге, в исправительных учреждениях, торговых центрах и во многих других сценариях.

 

Домофон поставляется в составе готовых решений охраны периметра. Он позволяет облегчить жизнь человека, т.к. идентифицирует его, пока тот ещё только приближается к двери или калитке охраняемого объекта, и открывает дверь автоматически. Это экономит несколько секунд времени и улучшает настроение, поскольку человек слышит персонализированное приветствие («Здравствуйте, Сергей Анатольевич!»).

 

Валидатор сравнивает изображение в паспорте (и других документах) с лицом предъявителя, может проверять документ на предмет подделки. Только сотрудники полиции и спецслужб проходят специальное обучение, которое позволяет им уверенно «узнавать» людей по фото. Обычно же в подобных ситуациях находится человек, который не обучен методам идентификации и не знает научных принципов, лежащих за этими методами. Валидатор позволяет бороться с мошенничеством со стороны сотрудников банков, сотовых операторов, а также может быть использован в пунктах паспортного контроля.

 

Логон позволяет решить две проблемы – доступ к рабочему компьютеру и обеспечение повышенной секретности для некоторых сотрудников. В обычном режиме он разблокирует windows-компьютер при появлении в кадре авторизованного пользователя. В режиме повышенной секретности, помимо этого, он блокирует компьютер, когда в кадре, помимо авторизованного пользователя, появляются другие лица.

 

НПК ООО «Простые Решения»

115991, г. Москва,

ул. Малая Тульская, д. 59,

Бизнес-центр «Сибинтек»,

офис 206А, 

тел.: 8 (495) 755 53 92

e-mail: Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.

www.smilart.ru

№264 Октябрь 2020
тема: строительство