Выбранный штат: Нью-Йорк

Как Госдеп США проверяет заявки и фотографии участников лотереи Green Card

Лотерея Green Card с момента своего возникновения и до настоящего времени была и остается самым простым способом иммиграции в США. Для миллионов людей, участвующих в DV-программе, выигрыш грин-карты в лотерею является единственным способом иммиграции, на который они могут рассчитывать. И тут важно не упустить свой шанс из-за досадной мелочи — ошибки в анкете или неправильного фото. Фотографии при проверке анкет уделяют огромное внимание. Давайте разберемся, чему стоит уделить особое внимание при заполнении анкеты.

Фото: Shutterstock

Процесс розыгрыша сам по себе не представляет ничего интересного. Компьютер произвольно отбирает из общей базы региона определенное количество победителей, всего по миру — от 100 до 150 тысяч. Учитывая, что виз только 50 тысяч, делается довольно большой запас, который покроет отсев в дальнейшем многих, а именно: «спортсменов», играющих для проверки своей удачливости; людей, которые, спокойно прикинув плюсы и минусы иммиграции, откажутся от продолжения процесса; судимых; не прошедших медицинскую комиссию; тех, кто не сможет собрать нужные документы или достаточно денег; дисквалифицированных из-за выявленных ошибок и обмана и так далее.

Помимо всех этих людей из 100-150 тысяч первоначально отобранных победителей будут отсеяны те, кто подал не одну, а несколько заявок.

Самая первая проверка при подаче заявки на лотерею грин-карт

Ежегодно для участия в лотерее грин-карт подают от 7 до 15 миллионов заявок (зависит от участвующих стран). Понятно, что обработка и проверка такого количество документов вручную — работа неблагодарная, она чревата большим количеством ошибок. По этой причине практически весь процесс обработки автоматизирован и поручен специальным компьютерным программам.

В момент подачи заявки встроенный валидатор проверяет, заполнены ли все необходимые поля анкеты и соответствуют ли прилагаемые фотографии заданным техническим параметрам. Это самая первая, техническая проверка. Она пропустит любые заявки, формально соответствующие правилам. Например, вполне возможна подача анкеты человеком по имени Yyyyyyy Xxxxxxx с фотографией, на которой нет изображения человека. Если это фото размером 600 на 600 пикселей, файл .jpeg меньше 240 килобайт, цветной снимок с 24-битной глубиной — все технические параметры файла соблюдены, заявка будет принята, Confirmation Number выдадут.

Однако участник Yyyyyyy Xxxxxxx никогда не получит уведомления о выигрыше — его заявку отвергнут на следующем этапе проверки, и участия в розыгрыше грин-карт она не примет.

Розыгрыш лотереи грин-карт и отсев “мусорных” заявок

По сути, проводится не один общий розыгрыш, а шесть отдельных — в каждом из шести регионов, на которые условно разделен мир для программы DV-lottery. Для каждого региона высчитывается определенная квота выигравших человек, сумма этих шести квот дает общее количество выигрышей — 100-150 тысяч.

В момент розыгрыша всем заявкам региона случайным порядком присваиваются новые номера (case numbers).

Затем производится проверка каждой заявки на соответствие техническим требованиям правил DV-лотереи. Программа берет заявку с номером 1, проверяет ее и дает заключение о ее соответствии требованиям. Затем переходит к заявке с номером 2 и так далее. Если программа обнаруживает не соответствующую заданным параметрам заявку, она помечает ее как “мусорную” и пропускает ее номер — подавший ее человек не увидит уведомления о выигрыше. Так программа проверяет заявки подряд до тех пор, пока квота не заполнится “хорошими” номерами.

Поскольку к анкетам при подаче заявки не прилагается никаких подтверждающих документов, установить верность указанных данных на этом этапе проверки не представляется возможным. Человека вполне могут действительно звать Yyyyyyy Xxxxxxx. Поэтому в дальнейшем проверяются только поданные фотографии.

Каждый файл изображения анализируется, при этом устанавливается, человек ли изображен на фото и соответствует ли его изображение композиционным требованиям.

Область изображения, в которой должна находиться голова, определена правилами — на эту область программа накладывает виртуальную маску, представляющую из себя усредненное отображение основных частей человеческого лица: глаз, носа, губ и т.д. Если параметры анализируемой области совпадают по определенным критериям с маской, фотография определяется как содержащая изображение лица. Одновременно программа проверяет, что перед ней именно фотография, а не, например, акварельный рисунок. Проверяется и качество изображения.

На этом этапе отбрасываются анкеты с приложенными снимками кошек, машин, облаков, черных квадратов и т.п. Такие анкеты люди обычно подают для того, чтобы посмотреть, как работает сайт, потренироваться перед подачей своей настоящей заявки.

Проверка соответствия композиционным требованиям

Правилами заданы довольно жесткие требования к изображению человека на фотографии: строго оговорены размер головы, уровень глаз, положение головы — ее наклон и поворот, цвет фона. При этом ничего не сказано об ушах, плечах, прическе, бороде и усах, макияже.

Соответственно, можно ожидать, что программа и будет проверять только то, о чем сказано.

Если голова на фото больше или меньше нужного, повернута вправо или влево, поднята или опущена, глаза выше или ниже, чем положено, — заявка будет отброшена при проверке. Если за прической не видны уши, плечи не на одном уровне, усы и борода скрывают рот, но пропорции соблюдены и человек смотрит прямо в камеру — заявка будет признана годной.

Во время этой проверки оценивается правильность фона и отсутствие теней на нем — контуры головы должны четко определяться на фоне. Тени на лице могут стать причиной дисквалификации, если программа из-за них не сможет распознать какие-то части лица.

Подготовка к первому этапу распознавания лиц

Почему же фото так тщательно проверяют? Не станет открытием утверждение: чтобы повысить свой шанс на выигрыш в любой лотерее, участник должен подать несколько заявок. Правилами DV-лотереи это запрещено, однако соблазн велик, и многие люди (и организации-посредники) прибегают к различным ухищрениям, чтобы обойти запрет.

Например, подают заявки с разными вариантами транслитерации имени и фото с разной прической. Чтобы компьютер смог понять, что это один и тот же человек, используется технология распознавания лиц (face recognition).

При проверке фотографий, поданных для участия в лотерее грин-карт, используют несколько ступеней машинного распознавания лиц. Каждый последующий алгоритм распознавания сложнее предыдущего, поэтому количество анализируемых изображений с каждым шагом уменьшается — до тех пор, пока не останутся фотографии, о которых программа с почти 100-процентной уверенностью сможет сказать, что на них изображен один и тот же человек.

Распознавание реализуется на основе разработанной компанией Visionic технологии FaceIt. Технологию FaceIt использует Государственный департамент (DoS) для проверки людей, обращающихся за получением любых виз на въезд в США.

Программа FaceIt работает с изображениями, соответствующими стандарту ISO/IEC 19794-5.

Рассматривается каждая приложенная к заявке на участие в лотерее грин-карт фотография и определяется ее пригодность для процесса распознавания, при этом оцениваются следующие параметры:

  • Размер головы — лицо достаточно большое?
  • Обрезка — лицо полностью видно на изображении?
  • Центрирование — лицо расположено достаточно по центру?
  • Экспозиция — не является ли изображение переэкспонированным или недоэкспонированным?
  • Глаза ясно видны — есть ли на человеке очки, и если да, глаза видны или скрыты?
  • Фокус — изображение хорошо сфокусировано?
  • Сжатие — не было ли изображение чрезмерно сжато, чтобы удалить детали кожи?
  • Текстура — содержит ли поверхность кожи текстуры, пригодные для использования в распознавания лица?
  • Разрешение — превышает ли разрешение изображения минимум, измеряемый в пикселях между глазами?
  • Faceness — можно ли назвать обнаруженный на изображении объект человеческим лицом или нет?

На этапе подготовки фотографии нормализуются — компьютер поворачивает снимки так, чтобы глаза на них располагались строго горизонтально (выравнивает лицо относительно вертикальной оси) и обрезает изображения в новый размер отсекая все лишнее. Снимки обрезают так, чтобы расстояние между центрами глаз на всех изображениях было одинаковым, выравнивается яркость и контрастность снимков.

Электронное распознавание лиц на фотографиях

Электронное распознавание применяют только к тем выигравшим заявкам, которые были признаны годными на предыдущих этапах проверки и фотографии из которых были успешно нормализованы.

Первый этап идентификации — векторное сравнение (VFA)

На первом этапе распознавания применяется алгоритм векторного сравнения (Vector Feature Analysis — VFA).

Суть данного метода распознавания заключается в том, что программа представляет каждое анализируемое нормализованное изображение лица как линейную комбинацию других, заранее созданных специальных изображений, так называемых собственных векторов или собственных лиц (eigenfaces). Получается код, содержащий информацию об этой комбинации. Так кодируется каждое изображение, требующее проверки.

Очень упрощенно “собственные лица” (“собственные векторы”) можно представить как набор неких стандартных компонентов лица, полученный путем статистического анализа, последующей выборки и обработки большого множества изображений разных лиц. При использовании этого метода принимается за аксиому, что любое человеческое лицо можно составить из “среднего лица” (компонента, который одинаков для всех лиц) прибавлением к нему определенного количества определенных “собственных лиц”. Большинство лиц может быть получено сложением небольшого количества “собственных лиц”.

Сравнивая затем полученные множества собственных векторов, система делает вывод о сходстве или различии исходных изображений.

Каждый файл с кодом, или шаблон, представляет собой простой список примененных собственных лиц (и процентного выражения вклада каждого лица в построенное из них изображение) и имеет совсем маленький размер, поэтому нельзя обратно восстановить изображение лица, используя лишь данные только одного этого шаблона. Однако из-за небольших размеров файлов шаблонов их сравнение между собой происходит очень и очень быстро.

После того как все файлы шаблонов готовы, программа сравнивает первую выигравшую заявку со всеми поданными немусорными. Она сравнивает шаблоны, полученные из фотографий на этапе кодирования оценивая совпадение кодов в процентном соотношении. Если совпадение проверяемого кода с любым другим не превышает определенного значения, программа делает вывод, что дубликатов у заявки не обнаружено.

Затем программа переходит к проверке следующей заявки — сверяя код фотографии из нее со всеми остальными кодами всех фотографий из всех поданных годных заявок. Так, одну за одной, программа проверяет все выигравшие в лотерее грин-карт заявки.

Если компьютер обнаруживает, что совпадение кодов двух сравниваемых фотографий превышает пороговое значение (это значение — один из настраиваемых параметров системы идентификации), программа делает об этом отметку и продолжает проверку исследуемого кода.

Таким образом, в результате первого этапа распознавания получаются пары (или тройки, четверки и т.д.) фотографий, которые система заподозрила в том, что на них изображен один и тот же человек.

Метод векторного сравнения — один из самых давних методов, применяемых для распознавания лиц. Он крайне требователен к тому, чтобы все анализируемые изображения были строго нормализованы. Значительные погрешности в принятии решения о сходстве сравниваемых лиц, свойственные такому методу, обусловленные небольшим количеством используемых собственных векторов, вынуждают применять его лишь в качестве самого грубого инструмента, основы для дальнейшего поиска дубликатов.

Второй этап идентификации — алгоритм сравнения иерархических графов лица (HGM)

Hierarchical Graph Matching (HGM) — это алгоритм сравнения лиц на основе анализа расположения контрольных узловых точек и расстояний между ними.

На лице определяется множество, свыше 2000 точек, начиная от центров глаз, переносицы, кончика и крыльев носа, левого и правого уголков рта и так далее, которые, соединяясь между собой, образуют так называемый граф, или маску, индивидуальную для каждого лица. Расстояния между точками поочередно заносят в файл, кодируя при этом изображение лица и делая его пригодным для математического сравнения.

Этот метод анализа не зависит от текстуры лица, исследует исключительно его форму. Создаваемые математические модели строятся по принципу “от крупного к мелкому”, что позволяет значительно ускорить процесс сравнения файлов.

Алгоритм HGM показывает достаточно хорошие результаты распознавания применительно к программе лотереи грин-карт, где анализируют строго нормализованные качественные изображения.

Третий этап идентификации — анализ локальных отличий (LFA)

Местным отличием (Local Feature) считается участок изображения, который отличается от других ближайших к нему соседних участков. Участок может отличаться по интенсивности, цвету или текстуре, но необязательно должен быть локализован именно по этому изменению. Местными отличиями могут быть точки, края, маленькие части изображения.

Процедура LFA описывает множество локальных взаимосвязанных значимых для восприятия полей, определяемых в каждой точке виртуальной сетки рецепторов, накладываемой на изображение лица. Эти поля различны друг от друга, оптимально складываются в исходное изображение, а на выходе различаются насколько возможно. Алгоритм создания файлов, описывающих зависимость этих полей, и последующего сравнения этих файлов является основой, применяемой для проверки фотографий на грин-карту системы FaceIt.

Во время LFA программа, вновь создавая кодированный файл, распознает и оценивает множество локальных отличий изображения лицевых структур. Система сравнивает созданные кодированные файлы и отмечает те, степень совпадения которых выше заранее определенного порога.

Одним из факторов, затрудняющих идентификацию лиц, является их изменчивость в зависимости от мимики. Даже небольшая полуулыбка приводит в движение большое количество мышц лица, при этом изменяются почти все расстояния между контрольными точками лица. Метод LFA, анализируя отличия локальных участков лица, к тому же определяемых с большим избытком, практически свободен от проблем, связанных с мимикой.

Четвертый этап идентификации — анализ текстуры поверхности лица (STA)

Surface Texture Analysis (STA) следует понимать как совокупность технологий и методов идентификации с использованием фотографий, позволяющих достаточно подробно рассмотреть текстуру кожи распознаваемых лиц. Соответственно, именно качество снимков имеет первостепенное значение для успешного распознавания.

STA применяется как дальнейшее развитие метода анализа локальных отличий, позволяющее использовать для сравнения еще более мелкие детали, которыми изобилует поверхность кожи любого человека.

Как правило, анализируется зона лица, свободная от излишне густой растительности — от низа глаз до начала верхней губы.

Вкратце метод STA можно описать так: сначала определяется средняя яркость каждого пикселя как среднее значение шкалы серого окружающих его пикселей. Затем изображение лица, путем сравнения значений шкалы серого пикселей в их средней яркости, преобразуется в бинарное изображение со значениями 1 или 0, присвоенными таким пикселям, средняя яркость которых выше заданной границы значений серого.

Затем выделенная зона лица разбивается на небольшие блоки. Для каждого блока из первого сравниваемого изображения система ищет соответствующий блок во втором изображении, лучше всего совпадающий со сравниваемым блоком.

После этого оценивается непрерывность соседних блоков. Если относительное изменение позиций пары соседних блоков ниже заданного порога, они рассматриваются как непрерывные. Чем больше непрерывных пар блоков, тем больше вероятность, что анализируемые изображения принадлежат одному и тому же человеку. Эта вероятность может быть сформулирована как функция количества непрерывных пар блоков.

Анализ текстуры поверхности требует, по сравнению с другими методами распознавания, большего времени для вычислений, поэтому применяется на финальной стадии идентификации к тем изображениям, для которых имеются достаточные основания считаться принадлежащими одному и тому же человеку. По данным фирмы-разработчика, применение, как дополнения к LFA, метода STA увеличивает точность распознавания на 20—25% позволяя уверенно отличать даже идентичных близнецов.

Распознавание ретуши фотографий для DVlottery

При проверке заявок на участие в лотерее грин-карт, в целях пресечения изменения изображений на фотографиях с использованием специальных графических программ и иных технических средств, применяется детекция ретуши.

Инструкция к лотерее грин-карт прямо говорит, что ретушь подаваемых фотографий запрещена — заявки, в фотографиях которых были сделаны какие-либо изменения (show manipulation in any way), будут дисквалифицированы.

Для детекции ретуши (под термином “ретушь” здесь подразумеваются любые изменения в фотографии, кроме обрезки в размер) применяют специальные программы, использующие при поиске изменений сочетание нескольких алгоритмов — от цветовых преобразований с наложением различных фильтров и распознавания непрерывности цепочек блоков пикселей, образующихся при сжатии изображения в jpeg, до анализа кода jpeg-файла.

Делая любые изменения в фотографиях, следует помнить о том, что, с большой долей вероятности, ретушь обнаружат. Безусловно, можно попытаться затруднить детекцию ретуши распечатыванием на бумаге и сканированием измененных фотографий, фотографированием экрана монитора с отретушированным изображением и тому подобными уловками, но нужно понимать, что используемые для проверки технологии могут включать в себя инструменты защиты от подобных манипуляций.

Результат проверки фотографий для лотереи грин-карт

Однозначного ответа, изображен ли на двух разных фотографиях один и тот же человек, компьютер дать не может. Он способен лишь оценить вероятность такого совпадения (безусловно, вероятность эта может приближаться к 100%). Однако окончательное решение всегда принимает человек.

В KCC для каждого выигравшего заводят кейс (дело), куда собирают присылаемые документы и результаты проведенных проверок. Если по результату проверки фотографий у заявки обнаруживают дубликаты (подозрение, что это дубликаты, превышает определенную величину), все эти подозрительные заявки тоже включают в кейс, в файле описания кейса делают об этом запись, а на бумажную папку с личным делом наклеивают красный лейбл с указанием причины.

Укомплектованное дело пересылают в тот консульский отдел, где будет проходить интервью. На интервью консул оценит все обстоятельства дела, ознакомится с результатами проверки фотографий и визуально сравнит найденные подозрительные анкеты видя перед собой живого человека, заявителя. Итогом будет решение, было ли нарушение правил, подавал ли заявитель несколько анкет. Соответственно, консул либо одобрит выдачу визы, либо сделает отказ.

В первый год функционирования DV-2006 (система распознавания лиц) среди победивших была обнаружена 5221 мошенническая заявка.

Обман системы поиска дубликатов на лотерее грин-карт

Подача нескольких заявок одним человеком является нарушением правил лотереи, влекущим автоматическую дисквалификацию заявителя.

За ложь консулу под присягой на интервью можно получить пожизненный запрет на въезд в США.

Консул, увидев в вашем кейсе несколько поданных заявок с разными фотографиями, распознанными программой проверки, обязательно заинтересуется обстоятельствами произошедшего. Если человек примется лгать, это приведет и к отказу в визе, и к пожизненному запрету на въезд.

Проблема в том, что заявитель не может точно знать, почему консул спрашивает об этом — действительно ли программа распознала его заявки или консул задает простой дежурный вопрос.

Исходя из этого, о способах обмана системы распознавания можно говорить исключительно теоретически, в исследовательских целях, а также для того, чтобы случайно не сделать что-то запрещенное.

 

Материалы взяты с сайта https://www.forumdaily.com/