MCG #57 : L’apport de l’IA contre la fraude fiscale (Interview Briot-Hadar 2/2)
Un ❤️ pour soutenir la missive.
Bienvenue dans cette Missive Compliance numéro 57 !
Tout d’abord, connaissez-vous l’Atelier de la Compliance ?
C’est un espace d’échange entre professionnels de la compliance que j’ai créé en octobre 2023 entre échanges informels à Paris (chaque mois) et des formats en ligne (masterclass en ligne, webinar sur l’IA, groupe Whatsapp détails ici ). Cette année, on va aussi travailler en atelier pour constituer des livrables qui répondent à une problématique compliance et diffuser ces livrables en open-source.
Envie de nous rejoindre ? Vous pouvez adhérer ici !
Maintenant, place à la missive 57 !
L’apport de l’IA contre la fraude fiscale
Suite à la missive 56 sur l’estimation et les schémas actuels de fraude fiscale, on explore l’apport de l’IA contre la fraude fiscale toujours avec Julien Briot-Hadar.
1 - On parle beaucoup de l’IA pour améliorer les contrôles fiscaux. Concrètement, depuis quand et comment l’intelligence artificielle est-elle utilisée au sein de la DGFiP en France ?
Le recours aux technologies avancées, et notamment l’intelligence artificielle, dans la gestion fiscale et la détection des fraudes a constitué un tournant majeur pour l’administration fiscale française. Ce processus s’inscrit dans une volonté de modernisation des outils de contrôle, permettant à la DGFiP de se doter de moyens de plus en plus sophistiqués. Ce changement, initié au début des années 2000 et amplifié au cours de la dernière décennie, soulève des questions tant sur le plan technique qu’éthique.
À travers une série de projets interconnectés, l’administration fiscale s’efforce d’adapter ses méthodes à l’ère numérique, afin de répondre aux défis posés par la fraude fiscale dans un contexte globalisé et digitalisé :
2002 projet ADONIS : le premier jalon significatif dans l’utilisation de la technologie pour le contrôle fiscal en France a été l’introduction, en 2002, du fichier ADONIS. Ce système permettait de traiter de manière automatisée les données fiscales des particuliers, en croisant des informations provenant de sources diverses. Bien que cet outil ne fasse pas directement appel à l’intelligence artificielle, il a constitué le socle sur lequel s’est construite une nouvelle approche du contrôle fiscal. Grâce à l’évolution des technologies, notamment du data mining, il est désormais possible d’effectuer des analyses beaucoup plus complexes, permettant de détecter des incohérences ou des anomalies dans les déclarations fiscales.
2014 projet CFVR : un tournant décisif a été marqué par le lancement du projet CFVR (Ciblage de la Fraude et Valorisation des Requêtes) en 2014. Ce projet a représenté un pas en avant majeur dans l’utilisation de l’intelligence artificielle pour traiter les volumes de données de plus en plus importants. Doté d’un budget de 34,5 millions d’euros, le projet CFVR a permis à la DGFiP d’automatiser le ciblage des fraudes, en analysant non seulement les déclarations fiscales, mais aussi en croisant ces données avec des informations externes, telles que celles relatives aux comptes bancaires ou aux biens immobiliers.
Au cours de la décennie suivante, l’intégration de technologies encore plus avancées, notamment des systèmes d’analyse prédictive et de machine learning, a permis d’amplifier les capacités de détection des fraudes.
2020 Projet PILAT : le projet PILAT (PILotage et Analyse du ConTrôle), lancé en 2020, marque une étape décisive dans cette démarche. Ce projet visait à renforcer la capacité de la DGFiP à analyser les liens entre différents contribuables et à cartographier les réseaux de fraude. L’un des outils centraux de ce projet est GALAXIE, mis en place en 2022, qui permet de cartographier les relations entre personnes physiques et morales, notamment en croisant des données fiscales et patrimoniales. GALAXIE a été conçu pour répondre aux défis complexes posés par des fraudes de grande envergure, impliquant des réseaux transnationaux ou des schémas de fraude sophistiqués. Initialement estimé à 36 millions d’euros, le budget du projet a été réévalué à 123 millions d’euros en raison de son expansion et de ses ambitions accrues. Ce système utilise des algorithmes d’apprentissage automatique pour identifier des structures de fraude cachées, tout en affinant les techniques de profilage fiscal.
2 - On génère de plus en plus de données en ligne par nos activités personnelles et professionnelles. Quel impact sur le travail de la DGFIP sur la fraude fiscale ?
L’une des caractéristiques déterminantes des projets récents de la DGFiP réside dans le recours à de nouvelles sources de données, notamment celles provenant des réseaux sociaux et de l’économie collaborative.
À partir de 2017, l’administration fiscale a lancé des expérimentations visant à intégrer les informations disponibles sur des plateformes telles que Facebook, Instagram, ou encore LeBonCoin. Ces nouvelles pratiques d’investigation visent à identifier des incohérences entre les déclarations fiscales des contribuables et leurs activités visibles en ligne.
Cette initiative est rendue possible par l’application des techniques de text mining, permettant de traiter des données non structurées telles que les publications sur les réseaux sociaux ou les images partagées. La finalité de ces analyses est de détecter des fraudes fiscales complexes, telles que la domiciliation fiscale frauduleuse ou les activités commerciales non déclarées. Le projet d’analyse des données issues des réseaux sociaux, autorisé par le décret du 13 février 2020, a permis de lancer une expérimentation à grande échelle visant à étudier des pratiques illicites, telles que la contrebande ou le commerce de biens interdits.
Un exemple emblématique de l’application de ces techniques est l’affaire de la domiciliation fiscale de Johnny Hallyday. L’administration fiscale a utilisé les contenus publiés sur les réseaux sociaux pour évaluer la résidence fiscale effective du chanteur, en croisant des informations telles que la géolocalisation de photos et la fréquence de ses déplacements entre la France et les États-Unis. Cette analyse a permis de déterminer si les critères de résidence fiscale, pertinents pour la succession, étaient respectés.
3 - L’utilisation par la DGFIP des réseaux sociaux a eu un retentissement auprès des particuliers, notamment au regard de la vie privée. Quel garde-fou existe-t-il sur le sujet ?
L’utilisation de ces technologies avancées soulève des préoccupations légitimes sur le respect de la vie privée. La CNIL a émis des réserves concernant l'impact potentiel de ces dispositifs sur les libertés individuelles, notamment en ce qui concerne la collecte et l'exploitation des données personnelles[1]. Les pratiques de l’administration fiscale sont soumises à des garanties strictes afin de préserver l’équilibre entre l’objectif de lutte contre la fraude et le respect des droits fondamentaux. En particulier, les agents de la DGFiP ne peuvent accéder qu’aux données manifestement publiques, telles que les informations partagées librement sur les réseaux sociaux. De plus, toute donnée collectée dans le cadre de ces investigations doit être détruite dans un délai de cinq jours si aucun soupçon de fraude n’est retenu. Par ailleurs, la DGFiP ne peut pas utiliser des outils tels que la reconnaissance faciale ni accéder à des informations privées ou à des communications protégées.
Enfin, la loi de finances pour 2024 a apporté une dimension nouvelle au dispositif en autorisant les agents de l’administration fiscale à créer de faux comptes et à interagir sur les réseaux sociaux sous des pseudonymes. Cette mesure renforce considérablement les pouvoirs d’investigation des services fiscaux, notamment en matière de lutte contre les pratiques de fraude fiscale et douanière. Bien que cette approche innovante permette de repousser les limites des moyens d’investigation traditionnels, elle soulève également des interrogations sur ses implications en termes de transparence et de respect des libertés individuelles.
[1] Denis M-L., La protection des données personnelles ne doit pas être la variable d’ajustement de l’IA, Le Monde, novembre 2024.