Glossaire
Ce document définit les termes courants utilisés pour décrire notre moteur de détection des secrets.
Détecteur
Ensemble de règles appliquées à un document pour trouver un type de secret (ex. : clés AWS, URI de base de données, clé Google…).
Détecteur générique
Un détecteur est générique si nous ne pouvons pas inférer directement le fournisseur du secret. Par exemple, un détecteur cherchant un motif du type secret={high_entropy_string} est générique.
Détecteur spécifique
Détecteur conçu pour un type de secret bien identifié : clés AWS, URI MySQL, jeton Slack, etc. On l'oppose souvent aux détecteurs génériques.
Affectation et variable affectée
Une affectation est toute instruction de la forme {assigned_variable} {assignment_token} {value}. Par exemple dans my_variable = "HelloWorld", la variable affectée est my_variable.
Document
Tout texte associé à un nom de fichier. Le nom de fichier est optionnel.
Entropie
Mesure du caractère aléatoire d'une chaîne. Une clé API doit avoir une entropie élevée car il s'agit d'une séquence générée aléatoirement. Dans cette documentation, « entropie » désigne l'entropie de Shannon.
Chemin de fichier / nom de fichier / extension
Conventions pour les chemins. Exemple config/secrets.yaml :
yamlest l'extension.secrets.yamlest le nom de fichier.config/secrets.yamlest le chemin (filepath).
Insight
Information complémentaire sur un document ou un secret.
Correspondance (match)
Chaîne faisant partie d'un secret. Un secret peut être composé d'une ou plusieurs correspondances.
Matcher
Règle de détection appliquée à un document et qui produit des correspondances.
PostValidator
Règle de validation appliquée à un candidat secret (ex. : vérifier que toutes les correspondances ont une entropie suffisante).
Précision
Proportion de secrets détectés qui sont de vrais secrets. Nous suivons cette métrique grâce aux retours clients.
PreValidator
Règle de validation appliquée à un document (ex. : rechercher « datadog » dans le document).
Priorité
Règle qui privilégie un secret par rapport à un autre en cas de chevauchement. Un secret détecté par un détecteur spécifique a toujours une priorité plus élevée qu'un secret détecté par un détecteur générique.
Rappel (recall)
Proportion de secrets réels que nous détectons et classons comme tels. Cette métrique est presque impossible à mesurer sans étiquetage humain.
Scanner
Collection de détecteurs. Dans le code, c'est le point d'entrée pour analyser un document, et le seul moyen d'en analyser un.
Secret
Combinaison de chaînes trouvées par un détecteur dans un document. Cette combinaison doit permettre d'accéder à un service privé.
Chevauchement de secrets
Deux secrets se chevauchent si l'une des correspondances de l'un est partiellement ou totalement incluse dans les correspondances de l'autre.
Vérification de validité
Appel non intrusif au service concerné permettant de déterminer si une clé est valide ou invalide. Certaines vérifications améliorent la précision et limitent les alertes aux secrets valides.