Publication institutionnelle · Sept. 2024 DSIN — Dép. Systèmes & Infrastructures Numériques Accès ouvert Publié septembre 2024

Sécurité des systèmes d'authentification face à l'augmentation des capacités de calcul assistées par IA

L'authentification par mot de passe demeure l'un des mécanismes de contrôle d'accès les plus largement déployés dans les infrastructures critiques civiles et scientifiques. L'augmentation rapide des capacités de calcul, combinée aux progrès des modèles d'intelligence artificielle, réduit significativement la durée de vie opérationnelle de schémas historiquement jugés sûrs.

Département DSIN Systèmes & Infrastructures Numériques — IFRAS
Réf. interneIFRAS-DSIN-2024-004
|
DiffusionContrôlée — Document institutionnel
|
DomaineCybersécurité · Cryptographie
Résumé

L'authentification par mot de passe demeure l'un des mécanismes de contrôle d'accès les plus largement déployés dans les infrastructures critiques civiles et scientifiques. Cependant, l'augmentation rapide des capacités de calcul, combinée aux progrès des modèles d'intelligence artificielle appliqués à l'optimisation des attaques, réduit significativement la durée de vie opérationnelle de schémas historiquement jugés sûrs. Cette étude présente une analyse quantitative de ces évolutions et examine les ajustements progressifs mis en œuvre dans les politiques internes de l'IFRAS.

Mots-clés : Authentification Mot de passe Entropie de Shannon Force brute Cryptographie IA & calcul Protection planétaire

1. Évolution historique des schémas d'authentification

Les premiers systèmes d'authentification informatisés, déployés à grande échelle à partir des années 1980 et 1990, ont été conçus dans un contexte technologique et opérationnel très différent de celui d'aujourd'hui. Les modèles de menace alors retenus reposaient principalement sur l'idée que l'attaquant devait disposer soit d'un accès physique prolongé aux machines, soit de ressources matérielles lourdes, coûteuses et rares. Les attaques à distance étaient limitées par la faible interconnexion des systèmes, l'absence d'Internet grand public et des débits réseau très réduits.

Dans les environnements institutionnels de l'époque (universités, administrations, grandes entreprises), les systèmes étaient majoritairement fermés, centralisés et administrés localement. Les comptes utilisateurs étaient hébergés sur des mainframes ou des serveurs Unix partagés, accessibles depuis des terminaux internes. Dans ce cadre, le risque principal était l'usurpation par un utilisateur légitime ou la compromission locale, bien plus que l'attaque automatisée à grande échelle. C'est dans ce contexte que les politiques de mots de passe ont été définies. Des schémas courts, combinant lettres et chiffres sur une longueur limitée (souvent 6 à 8 caractères), étaient considérés comme suffisants. Cette perception était renforcée par les contraintes d'ergonomie (claviers de terminaux, mémorisation humaine) et par le coût des attaques par force brute.

Sécurité des systèmes d'authentification

Au début des années 2000, un tel espace de recherche dépassait largement les capacités de calcul accessibles dans un cadre réaliste. Les processeurs grand public fonctionnaient à quelques centaines de MHz, et les architectures parallèles restaient réservées à des centres de calcul spécialisés. Une attaque exhaustive sur un tel espace pouvait théoriquement nécessiter des années, voire des décennies, même en supposant une vérification rapide des tentatives. De plus, les mécanismes de stockage des mots de passe reposaient souvent sur des fonctions de hachage cryptographique conçues pour être relativement coûteuses en calcul (comme DES-based crypt, puis MD5 ou SHA-1 dans certains contextes), ce qui ralentissait encore les tentatives hors ligne. La combinaison d'un espace de recherche large, d'une puissance de calcul limitée et d'un faible niveau d'exposition réseau rendait donc ces schémas acceptables au regard des risques perçus.

Cependant, ces hypothèses se sont progressivement effondrées avec la généralisation d'Internet, l'explosion de la puissance de calcul (CPU multicœurs, GPU, ASIC), la démocratisation du calcul distribué et l'industrialisation des attaques automatisées. Ce qui constituait autrefois une barrière économique ou technique est devenu aujourd'hui trivialement accessible, rendant obsolètes les modèles de sécurité hérités de cette période. Mais alors, comment bien se protéger et être certains de la robustesse de son mot de passe ?

2. Différents types d'attaque

Il existe plusieurs catégories d'attaques visant à compromettre les mécanismes d'authentification par mot de passe, chacune exploitant des leviers techniques, statistiques ou humains distincts.

Dans une analyse strictement cryptographique, excluant les faiblesses humaines et les compromissions système, le vecteur d'attaque le plus dominant reste la force brute. Ce sont donc ces approches qui constituent les principales références pour l'évaluation quantitative de la robustesse des mots de passe.

3. Calcul de l'entropie

Premièrement, nous devons définir la notion de « force » d'un mot de passe : on désigne communément par la « force » d'un mot de passe sa capacité à résister à une attaque par énumération exhaustive, plus connue sous le nom d'attaque par force brute. Ce type d'attaque consiste à tester systématiquement toutes les combinaisons possibles jusqu'à trouver la bonne. D'un point de vue conceptuel, la force d'un mot de passe peut être rapprochée de celle d'un mécanisme cryptographique : elle est comparable à la taille d'une clé de chiffrement. Plus cette « clé » est grande, plus l'effort nécessaire pour la casser augmente.

La robustesse d'un mot de passe est généralement exprimée à l'aide de l'entropie de Shannon, mesurée en bits. Cette mesure permet de quantifier l'imprévisibilité d'un mot de passe de manière compacte, sans avoir à manipuler directement des nombres de combinaisons souvent astronomiques. L'entropie représente la quantité d'information nécessaire pour deviner un mot de passe choisi aléatoirement dans un ensemble donné. Plus l'entropie est élevée, plus le mot de passe est théoriquement difficile à deviner. Cependant, il est crucial de souligner que l'entropie n'est qu'une mesure théorique. Un mot de passe peut afficher une entropie élevée sur le papier tout en étant extrêmement faible en pratique. Par exemple, "Password123*" respecte de nombreuses règles de complexité (majuscules, minuscules, chiffres, caractères spéciaux), mais reste trivial à casser car il repose sur des motifs humains largement intégrés aux dictionnaires d'attaque modernes. C'est pourquoi la génération réellement aléatoire des mots de passe est un facteur déterminant de leur sécurité effective.

Cette entropie se calcule à partir de la longueur du mot de passe (L), ainsi que la taille du jeu de caractères utilisé (B), aussi appelée pool. La formule est la suivante :

\[ E = L \times \log_2(B) \]

Voici un tableau représentant l'entropie de différents mots de passe en fonction du nombre de caractères utilisés et du nombre de pools possibles :

Tableau 1 — Entropie (en bits) selon la base et la longueur du mot de passe
Base / Longueur 8 caractères 12 caractères 15 caractères 18 caractères
Base 10(chiffres) 26 bits39 bits49 bits59 bits
Base 26(minuscules) 37 bits56 bits70 bits84 bits
Base 36(minuscules + chiffres) 41 bits62 bits77 bits93 bits
Base 52(min. + maj.) 45 bits68 bits85 bits102 bits
Base 62(min. + maj. + chiffres) 47 bits71 bits89 bits107 bits
Base 85(alphabet étendu + spéciaux) 51 bits77 bits96 bits115 bits

Nous avons donc une première mesure possible d'estimation de robustesse d'un mot de passe. Ceci étant dit, il est possible de développer légèrement ces équations. En effet, on peut déterminer le nombre total de combinaisons possibles par la formule :

\[ C = B^L \]

Voici le même tableau, mais représentant cette fois le nombre total de combinaisons possibles :

Tableau 2 — Nombre total de combinaisons possibles (C = B^L)
Base / Longueur 8 caractères 12 caractères 15 caractères 18 caractères
Base 10(chiffres) 100 000 0001,00e+121,00e+151,00e+18
Base 26(minuscules) 2,09e+119,54e+161,67e+212,94e+25
Base 36(minuscules + chiffres) 2,82e+124,73e+182,21e+231,03e+28
Base 52(min. + maj.) 5,35e+133,90e+205,49e+257,72e+30
Base 62(min. + maj. + chiffres) 2,18e+143,22e+217,68e+261,83e+32
Base 85(alphabet étendu + spéciaux) 2,04e+159,24e+225,09e+282,80e+34

Par conséquent, nous pouvons relier ce nombre avec l'entropie dans une seule et même équation :

\[ E = \log_2(C) \]

4. Temps estimé de cassage

Nous pouvons, grâce à cette entropie, en déduire le temps estimé de cassage. La complexité d'un mot de passe prend tout son sens lorsqu'on la relie à un temps de cassage estimé. Celui-ci dépend non seulement de l'entropie, mais aussi de la puissance de calcul disponible pour l'attaquant. Une estimation simplifiée du temps nécessaire pour casser un mot de passe est donnée par la formule :

\[ T = \frac{2^E}{R} \]
Les systèmes modernes de craquage, notamment basés sur GPU, peuvent atteindre des milliards, voire des trillions de tentatives par seconde pour certains algorithmes mal protégés. Cela rend les mots de passe courts extrêmement vulnérables, même s'ils paraissent complexes.

En réutilisant les deux mêmes tableaux utilisés précédemment, voici l'estimation du temps qu'il faudrait pour déchiffrer un mot de passe, avec une valeur arbitraire d'un milliard de tentatives par seconde (ce qui est déjà énorme) :

Tableau 3 — Temps estimé de cassage à 10⁹ tentatives/seconde
Base / Longueur 8 caractères 12 caractères 15 caractères 18 caractères
Base 10(chiffres) Instantanément17 minutes12 jours3,17e+1 années
Base 26(minuscules) 3 minutes3,03 années5,32e+4 annéesÉternité
Base 36(min. + chiffres) 47 minutes1,50e+2 années7,01e+6 annéesÉternité
Base 52(min. + maj.) 15 heures1,24e+4 annéesÉternitéÉternité
Base 62(min. + maj. + chiffres) 3 jours1,02e+5 annéesÉternitéÉternité
Base 85(alphabet étendu + spéciaux) 24 jours2,93e+6 annéesÉternitéÉternité
Ces estimations supposent un attaquant disposant de matériel GPU grand public (≈ 10⁹ hash/s). Des infrastructures spécialisées (clusters ASIC) peuvent dépasser 10¹² tentatives/s pour certains algorithmes non salés.

5. Analyse et conclusion

Pour mieux comprendre les tableaux précédents et différencier l'importance des deux paramètres B (nombre de pool) et L (nombre de caractères), nous avons séparé l'évolution de l'entropie en deux graphiques respectifs. Le premier affiche l'évolution de l'entropie en fonction de la taille du pool utilisé pour une longueur fixe donnée. Le second montre l'évolution de l'entropie en fonction de la longueur du mot de passe pour un pool fixé.

Sur ce premier graphique, on observe que, quelle que soit la longueur du mot de passe, l'entropie augmente toujours lorsque le nombre de caractères possibles dans le pool augmente.

De plus, on constate que les courbes associées aux longueurs plus élevées sont systématiquement au-dessus des autres.

L'écart entre les courbes s'accentue lorsque le pool devient plus grand, montrant un effet cumulatif entre longueur et diversité des caractères.

Entropie en fonction du nombre de pool

Sur ce second graphique, on constate que, de la même manière, pour tous les pools fixés, l'entropie augmente de manière quasi linéaire avec la longueur du mot de passe. Chaque caractère supplémentaire rajouté à un mot de passe apporte un gain significatif en sécurité, surtout lorsque le pool est important.

De plus, on observe aussi que les courbes associées aux pools plus élevés sont toujours au-dessus des autres, démontrant encore l'importance de ce paramètre.

Entropie en fonction de la longueur

Propriétés fondamentales d'un mot de passe robuste

Ces deux graphiques montrent clairement que la sécurité d'un mot de passe repose principalement sur deux facteurs : sa longueur et la diversité des caractères utilisés. L'augmentation de l'un ou de l'autre améliore l'entropie, mais c'est leur combinaison qui produit le gain le plus important. Ainsi, pour créer des mots de passe réellement robustes, il est recommandé d'utiliser des mots de passe longs, composés d'un large éventail de caractères (lettres minuscules et majuscules, chiffres et symboles). Cette approche permet de rendre les attaques par force brute et par dictionnaire beaucoup plus difficiles, voire irréalistes en pratique.

De ces éléments, on peut tirer trois propriétés fondamentales d'un mot de passe robuste :

Les identifiants existants ne sont pas rétroactivement modifiés. Cette décision vise à éviter toute perturbation des systèmes historiques dont la stabilité repose sur des configurations validées antérieurement.
Références bibliographiques
NIST SP 800-63BDigital Identity Guidelines — 2023
Veras et al.On the Semantic Patterns of Passwords — IEEE S&P
IFRASRapport interne sur la résilience des systèmes d'accès — 2024
Diffusion : Document institutionnel à diffusion contrôlée — IFRAS. — Département : Systèmes & Infrastructures Numériques (DSIN). — Date de publication : Septembre 2024. — Conflits d'intérêts : Aucun.