Perspectives

Solutions d’intelligence artificielle (IA) pour la vérification de l’identité numérique : Aperçu des technologies d’apprentissage automatique utilisées dans les systèmes de vérification de l’identité numérique

AVERTISSEMENT : Les articles reflètent les intérêts et les opinions de leur auteur et ne sauraient constituer des déclarations ou des prises de position officielles de Paiements Canada.


Résumé1

Dans un monde de plus en plus numérique où les préoccupations relatives à la fraude et à l’utilisation abusive des données personnelles augmentent, on réclame des méthodes plus efficaces de vérification de l’identité qui vont au-delà de l’utilisation des documents d’identification traditionnels comme les permis de conduire et les passeports. L’identité numérique est une solution de rechange aux identifiants traditionnels qui permettent de vérifier l’identité au moyen d’une combinaison d’identifiants existants et de renseignements personnels attribués à une personne. Toutefois, les systèmes de vérification de l’identité numérique ont démontré une exactitude et une précision accrues grâce à l’intégration de technologies d’apprentissage automatique et d’IA.

Le présent document donne un aperçu de la façon dont les systèmes de vérification de l’identité numérique fonctionnent avec les technologies d’IA et d’apprentissage automatique au moyen des processus de vérification des documents d’identification et des données biométriques et de ce qu’un cadre d’identité numérique cohérent peut faire pour l’industrie des paiements.


Vérification de l’identité numérique

La pandémie de COVID-19 a fait passer le monde « en ligne ». De nombreux milieux de travail sont passés au travail à distance (certains de façon permanente), un plus grand nombre de consommateurs font des achats en ligne et la prestation de services publics se fait en ligne ou par téléphone. En raison de ce virage massif vers le numérique, la sécurité et la vérification de l’identité deviennent une préoccupation clé. L’identification numérique est une solution d’authentification de l’identité qui peut aider les gens à prendre le contrôle de leur identité, à réduire la fraude associée au vol d’identité et à faciliter les processus de confirmation de l’identité du client dans l’ensemble des secteurs. Traditionnellement, les documents d’identification ont été vérifiés manuellement, mais l’expansion des secteurs vers des environnements numériques a démontré le besoin de solutions de vérification de l’identité évolutives qui peuvent répondre aux besoins croissants des consommateurs, comme les identités numériques.

Les processus de vérification de l’identité numérique permettent à une personne de vérifier son identité pour un certain nombre de cas d’utilisation, comme le paiement d’un achat ou l’ouverture d’une session dans un environnement de travail sécurisé lorsque la personne et son identité physique ne sont pas présentes. La vérification de l’identité numérique repose sur des méthodes comme la biométrie et la reconnaissance faciale, où « l’identité » évaluée est une image numérique et où les utilisateurs se présentent simultanément au moyen d’une capture d’image numérique – soit une photo ou une vidéo.

Alors que des pays et des institutions entières travaillent à la mise en œuvre de cadres et de processus d’identification numérique, il est nécessaire d’avoir des méthodes rapides, évolutives et, surtout, précises pour la vérification de l’identité. À cette fin, nous constatons de plus en plus l’intégration de processus d’IA et d’apprentissage automatique dans les produits d’identification numérique.

Qu’est-ce que l’IA et l’apprentissage automatique?

L’IA est la capacité d’un système informatique d’imiter les fonctions cognitives humaines comme l’apprentissage et la résolution de problèmes. Grâce à l’IA, un système informatique utilise une combinaison de mathématiques et de logique pour simuler le raisonnement que les gens utilisent pour apprendre de nouvelles informations et prendre des décisions.

L’apprentissage automatique est une application de l’IA. C’est le processus d’utilisation de modèles mathématiques de données pour aider un ordinateur à apprendre sans avoir besoin d’instructions directes. Cela permet à un système informatique de continuer à apprendre et à s’améliorer par lui-même, en se fondant sur l’expérience et la mémoire.

Les modèles d’apprentissage automatique comme les réseaux de neurones à convolution sont utilisés pour de nombreuses tâches comme la reconnaissance d’images et de vidéos, l’analyse et la classification d’images, etc. (figure 1). Ils sont très pratiques pour la reconnaissance des objets et du visage et sont souvent utilisés par les chercheurs comme technologie de pointe pour la vérification de l’identité numérique.

Les réseaux de neurones à convolution sont principalement utilisés pour travailler avec des données d’image. Ils se composent de trois couches. La première couche (couche d’entrée) prend en compte l’image à classer. La couche suivante (couches cachées) permet d’extraire des caractéristiques d’identification clés de l’image à des fins de classification. La couche finale (couche de sortie) détermine si l’image qui est classifiée est une correspondance et, en fin de compte, vérifie l’identité2.

 

pp_iasolutions_fig1.png

Figure 1 : Le réseau de neurones à convolution utilisé pour la classification des images (Paiements Canada)

Pourquoi utiliser l’IA pour la vérification de l’identité numérique?

Près de 6 Canadiens sur 10 (57 %) ont vu le nombre de tentatives de fraude les visant augmenter cette année3. Cette tendance devrait se poursuivre et se généraliser dans toutes les sphères de la vie. Les géants de la technologie comme Google et Facebook ont amassé une énorme quantité de données personnelles et exposent leurs utilisateurs au risque de vol d’identité (Khan, 2018). Le programme d’identité numérique, qui sera bientôt mis en œuvre par le gouvernement de l’Ontario (Davidson, 2021), rend également les citoyens vulnérables aux cyberattaques concernant le vol d’identité4. L’incidence de la COVID-19 sur la fraude au Canada est également énorme, avec 144 millions de dollars canadiens perdus en raison d’activités frauduleuses en août 2021 (Centre antifraude du Canada, 2021).

La question de l’efficacité et de l’efficience de la vérification de l’identité d’une personne afin qu’elle puisse accomplir des tâches numériques en toute sécurité est l’un des enjeux fondamentaux de notre époque.

Il est difficile de vérifier les identités de manière efficace et à un volume élevé. L’inspection manuelle des identités à elle seule, bien qu’elle soit relativement précise si elle est effectuée par des experts, ne fonctionne pas bien pour de grands volumes de cas. Heureusement, les technologies d’IA et d’apprentissage automatique mûrissent. Grâce à l’intégration de ces outils, on peut vérifier l’identité en ligne pour une multitude de cas d’utilisation : les entreprises peuvent intégrer des employés en toute confiance, partout dans le monde, avec un identifiant et une connexion Internet; l’âge peut être vérifié pour des achats comme l’alcool; les gouvernements pourront verser des fonds aux utilisateurs finaux, etc.

Il y a plusieurs avantages à utiliser un système géré par l’IA (Matthers, 2019) :

  1. Il devient plus facile et plus rapide de déterminer la véritable identité des personnes.
  2. Il est difficile de contourner un système de vérification de l’identité fondé sur la reconnaissance faciale.
  3. Les algorithmes d’apprentissage automatique détectent les tentatives sophistiquées de falsification avec plus de précision que l’intervention humaine.
  4. De tels systèmes peuvent être adaptés à un grand nombre de demandes de vérification.

Les banques et les institutions financières explorent activement les solutions de vérification de l’identité alimentées par l’IA et l’apprentissage automatique pour détecter la fraude et prévenir le blanchiment d’argent (Insights Team, 2018).

Comment un système de vérification de l’identité numérique fonctionne-t-il?

Il existe de nombreuses méthodes de vérification de l’identité numérique qu’un système de vérification alimenté par l’IA peut posséder, qui fonctionnent toutes de différentes façons. Les méthodes les plus fondamentales et essentielles sont les suivantes :

  1. Vérification des documents d’identification : Vérifie que la photo numérique de la pièce d’identité (p. ex., permis de conduire, passeport, pièce d’identité du gouvernement) fournie par l’utilisateur est légitime.
  2. Vérification biométrique : Utilise une image faciale ou une vidéo fournie par l’utilisateur pour établir que la personne qui présente la pièce d’identité est la même que celle dont le portrait apparaît sur la pièce d’identité. On demande aux utilisateurs d’effectuer certaines tâches pour des mesures de sécurité supplémentaires tout en étant « en direct » sur une webcaméra.

Vérification des documents d’identification

Lorsqu’un utilisateur fournit une pièce d’identité légale, comme un permis de conduire ou un passeport, elle est habituellement délivrée par le gouvernement. Chaque document d’identification a un format et une présentation uniques des données. Ces documents comprennent également des caractéristiques de sécurité comme les filigranes, les totaux de contrôle, les hologrammes, les codes lisibles par machine, etc. Chacun de ces facteurs est important lors de la vérification d’un document d’identification comme preuve d’identité légale.

Un système de vérification des documents d’identification vise à déterminer si une image d’entrée appartient à une catégorie authentique de documents d’identification et si le document est légitime. Plusieurs défis doivent être relevés pour accepter le document comme authentique.

  1. Localisation du document : le système isole le document d’identification de l’image prise par l’utilisateur dans un environnement non contrôlé, comme les arrière-plans, les angles et les qualités de la caméra.
  2. Classification du document : le système classe le type document d’identification soumis par l’utilisateur.
  3. Vérification des documents : le système détecte toute falsification de documents perceptible.

Localisation des documents
La localisation des documents consiste à extraire des documents d’une image donnée et à les traiter. Cela garantit une entrée standard dans le système de vérification de l’identité. Il est obtenu grâce à un modèle de détection d’objet basé sur la région qui détecte un objet dans une image avec ses coordonnées. Grâce à ces informations, l’image est rognée et transformée en orientation appropriée. Le rognage et la transformation garantissent une image normalisée où l’identifiant est clair et orienté au centre.

Un système pareil utilise des réseaux de neurones à convolution pour repérer les quatre coins d’un document d’identification dans une image numérique (Javed et Shafait, 2017). La figure 2 illustre la séquence du processus.

 

pp_iasolutions_fig2_1.png

Figure 2 : Localisation des documents à l’aide des réseaux de neurones à convolution (Castelblanco et coll., 2020)

Classification des documents
Un système de classification des documents sert à identifier la catégorie du document en fonction de l’image numérique du document d’identification reçue. Pour ce faire, ce système détermine le pays d’émission, le type de document et sa version. Les types de documents comprennent les cartes d’identité nationales, les passeports, les permis de conduire, etc. L’un des systèmes de pointe utilisés pour la classification des documents utilise des réseaux de neurones à convolution préqualifiés. Le réseau de neurones à convolution extrait des caractéristiques clés de l’image, qui sont des parties et des motifs présents dans l’image d’identification qui peuvent aider à l’identifier (Simon et coll., 2015).

Vérification des documents
Une pièce d’identité émise par le gouvernement contient des renseignements comme des images de clients, des sceaux, des hologrammes, des estampilles de texte, etc. Il est important de valider tous les éléments de sécurité d’un document numérisé, car il arrive qu’une petite partie du document ait été falsifiée et que toutes les autres parties soient authentiques. Par exemple, sur n’importe quelle pièce d’identité, l’hologramme et le sceau sont authentiques, mais l’image présente dans le document est falsifiée, ou l’image, le sceau et l’hologramme sont authentiques, mais la signature est falsifiée, etc.

Un système de vérification des documents vérifie les caractéristiques de sécurité susmentionnées. Un système mis au point par Sirajudeen et Anitha (2020) utilise encore une fois les réseaux de neurones à convolution ainsi que les algorithmes de reconnaissance optique de caractères (ROC) et d’orientation rapide et rotation brève (Oriented FAST and rotated BRIEF [ORB]) pour extraire et analyser l’authenticité textuelle (nom, signature, etc.) et l’authenticité de l’image (sceau, timbre, hologramme) d’une pièce d’identité, comme le montrent les figures 3.a et 3.b

 

pp_iasolutions_fig3_0.png

Figure 3 : Utilisation de la ROC et de l’ORB pour la vérification des documents

Les résultats de l’extraction de texte (ROC) et de l’extraction d’image (ORB) sont alimentés dans un réseau de neurones à convolution pour vérifier l’authenticité de l’identité numérique. La couche de sortie du réseau de neurones à convolution classe les valeurs d’entrée avec des valeurs probabilistes comprises entre 0 et 1. Si la valeur résultante est de 1, le document numérisé est considéré comme étant falsifié. Si la valeur probabiliste de tous les éléments du document (texte, sceau, cachet et hologramme) est de 0, alors le document est classé comme un document authentique.

Vérification biométrique

Après avoir confirmé que la copie numérique du document d’identification est authentique, le système doit confirmer que l’utilisateur distant présentant l’identité est son propriétaire autorisé. La preuve de propriété peut être établie en effectuant une vérification biométrique, y compris la vérification faciale et la détection de la vivacité.

Les utilisateurs frauduleux peuvent tenter de tromper le système avec une impression du visage de la cible ou des masques 3D sophistiqués. Les systèmes de vérification biométrique basés sur l’intelligence artificielle et l’apprentissage automatique peuvent à nouveau protéger contre ces attaques. 

Vérification faciale
Un système de vérification faciale compare l’image faciale fournie par l’utilisateur à l’image faciale présente sur la pièce d’identité (figure 4). Cela permet de confirmer que l’utilisateur qui se présente est autorisé à utiliser l’identité. Le système peut correspondre à des caractéristiques comme la texture de la peau, la couleur et plusieurs autres.

 

pp_iasolutions_fig4.png

Chinapas et coll., 2019 ont mis au point un système qui compare automatiquement un visage sur une photo de carte d’identité et une photo de visage pour accélérer et accroître l’exactitude de la procédure de vérification de la carte d’identité. Ils ont utilisé l’algorithme MTCNN pour la détection faciale et l’algorithme ArcFace pour la comparaison faciale.

Le MTCNN, tel que décrit dans (Zhang et coll., 2016), est un cadre élaboré comme solution pour la détection du visage. Il se compose de trois phases de réseaux de neurones à convolution qui peuvent reconnaître des visages et des points de repère comme les yeux, le nez et la bouche.

Le réseau utilise une structure en cascade avec trois réseaux : d’abord, l’image est reprogrammée à une gamme de tailles différentes, puis le premier réseau propose les régions faciales de l’utilisateur, le second réseau filtre la zone limitative (la région qui contient l’image faciale de l’utilisateur) et le troisième réseau propose les repères faciaux5.

ArcFace (Deng et coll., 2019) est un modèle d’apprentissage automatique qui prend deux images faciales comme entrées et produit la différence quantitative entre elles pour voir si elles sont susceptibles d’être la même personne. Si la différence est inférieure à la valeur du seuil, elle considère que les deux visages correspondent. Par contre, si la différence est supérieure au seuil, cela signifie que les deux visages ne sont pas de la même personne6.

Figure 4 : Pipeline pour un système de vérification faciale (Chinapas et coll., 2019)

Détection de la vivacité
La détection de la vivacité peut être ajoutée comme couche de confiance supplémentaire dans un système de vérification biométrique pour assurer la présence du même utilisateur qu’il prétend être. Des gestes faciaux simples comme un sourire, un mouvement de la tête, etc., peuvent aider à détecter les attaques de mystification comme une vidéo, un masque facial ou une photo d’une photo (figure 5).

 

pp_iasolutions_fig5.png

La forme la plus courante de détection de la vivacité demande à l’utilisateur d’effectuer une série de défis en temps réel comme « dire le numéro 429 et tourner la tête vers la droite ». La vidéo sera analysée en temps quasi réel avec l’image d’identification afin de vérifier la vivacité des utilisateurs et de comparer le visage extrait de la vidéo au visage sur le document d’identification.

Les techniques logicielles existantes de détection de la vivacité peuvent être classées en quatre catégories : (1) des méthodes d’analyse de la texture qui peuvent analyser les propriétés de la peau, y compris les propriétés de la peau et la réflectance de la texture (Li et coll., 2004) (2) des méthodes d’analyse du mouvement qui examinent les signaux de mouvement spontané dans les produits contrefaits présentés dans les systèmes de reconnaissance (Anjos et Marcel, 2011) (3) des méthodes d’analyse de la qualité de l’image qui utilisent des mesures de la qualité de l’image pour détecter la mystification (Galbally et coll., 2013) et (4) des méthodes d’apprentissage automatique qui s’inspirent du succès récent des réseaux de neurones à convolution (Li et coll., 2016) et (Akbulut et coll., 2017).

Figure 5 : Base de données de visages contre la mystification : attaque de photos en direct sur la première rangée, attaque de photos enveloppées sur la deuxième rangée, attaque de photos coupées sur la troisième rangée, attaque vidéo sur la quatrième rangée. Première colonne : qualité faible, deuxième colonne : qualité normale, troisième colonne : qualité élevée (Akbulut et coll., 2017)

Que peut faire l’identité numérique pour les paiements?

L’importance de l’authentification de l’identité est cruciale dans le contexte actuel du marché, qui comprend l’augmentation des risques pour la sécurité, l’utilisation abusive des données et la transition vers notre « nouvelle normalité » qui consiste à tout faire à distance. Comme nous l’avons mentionné plus haut, comme plus de gens restent à la maison, il y a eu une augmentation considérable de la demande de solutions d’identité numérique dans toutes les industries. Les cas d’utilisation par les entreprises ont explosé, et la sécurité demeure une priorité pour celles qui essaient de protéger leurs données, compte tenu de l’augmentation du nombre de travailleurs à distance et de la dépendance à l’égard des réseaux non sécurisés et des réseaux privés virtuels. L’identité numérique s’est imposée comme une solution de rechange moins coûteuse, plus sûre et plus rapide aux processus traditionnels d’authentification de l’identité pour les entreprises. Bien que l’identité numérique puisse être utilisée pour accroître l’efficacité opérationnelle dans tous les secteurs, elle ouvre tout un monde de possibilités pour les paiements.

Une sécurité des paiements moins coûteuse et améliorée
La mise en œuvre de l’identité numérique peut pousser la sécurité, la connaissance du client et l’authentification forte du client (AFC) des paiements vers l’avenir tout en réduisant le montant perdu à cause de la fraude. Profitant de la pandémie de COVID-19 et du virage marqué vers les paiements numériques, les fraudeurs ont eu davantage l’occasion de tirer parti des consommateurs en utilisant des méthodes de paiement nouvelles ou différentes. Les Canadiens ont perdu environ 144 millions de dollars à cause de la fraude depuis 2020 (en date de septembre 2021, Centre antifraude du Canada). Les banques, en particulier, s’efforcent de moderniser leurs approches en matière de fraude et, étant donné que les coûts de l’authentification de l’identité et d’autres mesures de lutte contre la fraude augmentent considérablement (la True Cost of Financial Crime Compliance Study [Étude sur le coût réel de la criminalité financière] indique une augmentation de 33 % du coût des mesures de conformité de 2019 à 2020), une solution d’identité numérique normalisée semble être une solution optimale. Dans le monde entier, la mise en œuvre de cadres d’identification numérique a considérablement réduit les coûts des processus de confirmation de l’identité du client et de la lutte contre le blanchiment d’argent. En Inde, il a été démontré que le cadre d’identification numérique d’Aadhar réduit le coût de la vérification de la confirmation de l’identité du client de 5 à 0,70 US $ par client tout en réduisant le taux d’erreur d’authentification (Mahajan et coll., 2019).

Permettre les paiements numériques omniprésents
Accélérés par la COVID-19, les paiements numériques sont maintenant à l’avant-garde des paiements : les paiements numériques représentent maintenant 79 % de tous les paiements au Canada (Yun, Paturi, 2021) et, comme un plus grand nombre de consommateurs sont à l’aise avec les paiements numériques, nous pouvons nous attendre à une évolution des offres de paiement. L’identité numérique peut permettre une expérience de paiement harmonieuse à mesure que le marché canadien des paiements évolue pour inclure des innovations comme les services bancaires ouverts, les paiements intégrés et les paiements en temps réel. Les cadres d’identification numérique sont souvent utilisés de concert avec les systèmes de paiement en temps réel, car la vérification de l’identité peut être effectuée en temps réel ou presque avec un degré élevé d’exactitude. Cela permet de simplifier le processus et de normaliser davantage l’authentification des pièces d’identité dans des cas comme les cadres bancaires ouverts où des fournisseurs tiers comme les entreprises de technologie financière et les fournisseurs de services de paiement alternatifs peuvent tirer parti des identités numériques établis par les institutions financières titulaires. L’intégration de l’identité numérique peut réduire les coûts et les obstacles à l’entrée pour les fournisseurs tiers et contribuer à un paysage des paiements concurrentiel et innovateur.

Conclusion

Au fur et à mesure que les entreprises et les fournisseurs de services se sont branchés et que la COVID-19 a vu le jour, ce qui a incité les milieux de travail à se brancher, la sécurité et l’authentification sont devenues l’une des principales préoccupations. Par conséquent, un système de vérification de l’identité numérique fondé sur la technologie de l’intelligence artificielle et de l’apprentissage automatique permettra de détecter la falsification sophistiquée de documents d’identification et sera évolutif afin d’accroître les demandes des clients et la rapidité et l’efficacité des systèmes de vérification. Il faut donc établir une solide défense contre les activités frauduleuses en ligne.


1 The views presented in this paper are those of the authors and do not necessarily reflect the views of Payments Canada.

2 Pour obtenir une explication plus détaillée du fonctionnement des réseaux de neurones à convolution, veuillez cliquer ici.

3 Veuillez consulter les Nouvelles d’Interac pour en savoir plus.

4 Des mesures de dissuasion du risque, comme des capacités hors ligne pour les identités sont prévues afin de réduire cette vulnérabilité.

5 Pour en savoir plus, veuillez consulter : Multi-task Cascaded Convolutional Networks (MTCNN) for Face Detection and Facial Landmark Alignment.

6 Pour en savoir plus, veuillez consulter : ArcFace: A Machine Learning Model for Face Recognition.


Authors

 

gobooth_-_ottawa_photo_booth_rental_-_payments_canada_-_headshots-shamidpayments.ca_1_1.jpg

Sania Hamid
Scientifique de données débutante

En tant que scientifique des données de l’équipe de recherche, Sania mène des recherches sur les façons d’appliquer l’apprentissage machine et l’intelligence artificielle aux marchés financiers. Avant de se joindre à Paiements Canada, elle a obtenu une maîtrise en informatique de l’Université Carleton, où elle a travaillé à son mémoire sur l’affectation des passagers pour le covoiturage par l’apprentissage supervisé.

 

 

 

avatar_10.png

Pooja Paturi
Analyste des renseignements sur le marché

Travaillant avec les équipes de la recherche et de la stratégie, Pooja effectue des recherches et donne des conseils stratégiques sur les nouvelles technologies de paiement et les développements dans l’écosystème des paiements, en mettant l’accent sur les monnaies numériques. À l’université, Pooja a étudié l’économie politique.

Continuer à lire