La réforme de la facturation électronique a été discutée pendant des années comme un sujet fiscal et comptable. C'en est un. Mais à quelques semaines de la première échéance, je vois arriver un tout autre problème, et il est de nature données. Le pivot de tout le dispositif, c'est un identifiant que la plupart des entreprises ont longtemps rempli sans y penser : le SIREN de leurs clients.

À partir du 1er septembre 2026, ce numéro de 9 chiffres n'est plus une donnée administrative parmi d'autres. Il devient l'adresse à laquelle la facture est livrée. S'il est absent, faux ou rattaché à une entreprise qui n'existe plus, la facture ne part pas.


Ce qui change au 1er septembre 2026

En bref : à partir du 1er septembre 2026, le SIREN du client (9 chiffres) devient une mention obligatoire de la facture électronique et sert d'adresse de routage via l'annuaire central. Le SIRET reste accepté, mais n'est utile au routage que pour les clients multi-établissements.

La réforme concerne les factures entre entreprises assujetties à la TVA et établies en France. Deux obligations se mettent en place à des rythmes différents, selon le calendrier fixé par l'administration fiscale :

Échéance Ce qui devient obligatoire
1er septembre 2026 Réception des factures électroniques pour toutes les entreprises ; émission pour les grandes entreprises et ETI
1er septembre 2027 Émission pour les PME, TPE et micro-entreprises

Concrètement, une facture ne circule plus en PDF par email. Elle transite par des plateformes agréées (PA), et un annuaire central, géré par l'AIFE (Agence pour l'informatique financière de l'État), sert d'aiguillage entre l'émetteur et le destinataire. C'est là que le SIREN entre en jeu : il devient une mention obligatoire de la facture, et il sert de clé pour trouver où livrer le document.

On peut voir le SIREN comme l'adresse postale de la facture. La plateforme du destinataire ne cherche pas « l'entreprise Dupont » par son nom, ni par son adresse géographique. Elle interroge l'annuaire avec le SIREN. Pas de SIREN valide, pas de destination.

SIREN, SIRET : la distinction qui décide tout

On confond les deux depuis toujours, et jusqu'ici ça se réglait à la main. La réforme rend la distinction opérationnelle.

Le SIREN, ce sont 9 chiffres. Il identifie l'entreprise en tant que personne morale, et il ne change pas tant qu'elle existe.

Le SIRET, ce sont 14 chiffres : le SIREN suivi de 5 chiffres qui désignent un établissement précis. Un siège, un entrepôt, une agence : chacun a son propre SIRET.

SIREN SIRET
Longueur 9 chiffres 14 chiffres (SIREN + 5)
Identifie L'entreprise (personne morale) Un établissement précis
Stabilité Ne change pas tant que l'entreprise existe Change si l'établissement ferme ou déménage
Facture électronique Mention obligatoire et clé de routage Accepté ; routage fin réservé aux multi-établissements

Pour la facture électronique, l'obligation porte sur le SIREN. Le SIRET reste accepté, puisqu'il contient le SIREN, mais la maille établissement n'a d'intérêt pour le routage que si votre client est multi-établissements et a demandé à recevoir ses factures au niveau de chaque site. Dit autrement : le SIREN amène la facture à la bonne entreprise, le SIRET l'amène au bon bâtiment quand l'entreprise l'a configuré ainsi.

Le point qui piège le plus de référentiels : un SIRET peut être fermé alors que l'entreprise est bien vivante. L'établissement déménage ou cesse son activité, l'INSEE le bascule en état « fermé », et le SIREN, lui, reste actif. Vérifier qu'un identifiant est bien formé (14 chiffres, clé de Luhn correcte) ne dit rien de sa validité réelle. Un numéro impeccable dans sa forme peut pointer vers un établissement qui n'existe plus depuis trois ans.

Pourquoi une facture est rejetée : la mécanique du routage

Prenons un cas concret, du genre que je vois se répéter.

La facture est parfaite. Bon montant, bonne TVA, toutes les mentions légales. Elle est quand même rejetée. La raison : le SIREN du client était celui d'une entité fermée depuis un an. L'entreprise avait été rachetée puis restructurée, l'ancien SIREN n'était plus actif, et personne côté fournisseur n'avait mis la fiche à jour.

Le déroulé est simple. Vous émettez la facture, elle part vers votre plateforme agréée, qui interroge l'annuaire central à partir du SIREN pour savoir où la livrer. Si ce SIREN ne correspond à rien d'actif, la plateforme n'a pas d'adresse où livrer. Elle ne peut pas router, et la facture revient.

Ce qui change par rapport à hier, c'est que rien ne prévient en amont et que personne ne rattrape l'erreur au téléphone. Tant qu'un humain saisissait un numéro sur un PDF, une coquille passait et se corrigeait plus tard. Maintenant, une machine décide en temps réel, et elle dit non.

Le cas jumeau, pour les clients multi-établissements : le bon SIREN mais le mauvais SIRET, et la facture atterrit au mauvais service.

Le SIREN comme clé de déduplication

L'obligation réglementaire n'est qu'une face du sujet. L'autre, c'est que le SIREN est de loin la meilleure clé pour nettoyer une base tiers.

Le scénario est classique. « On a 4 200 fournisseurs », dit l'équipe achats. En réalité, il y en a beaucoup moins : le même fournisseur a été saisi plusieurs fois, sous des écritures différentes.

Dupont & Fils
DUPONT ET FILS SARL
Ets Dupont

Trois fiches, parfois trois RIB, un reporting achats qui ment, et une négociation fournisseur affaiblie parce que le volume réel est éclaté sur plusieurs lignes. La cause est presque toujours la même : on a voulu dédoublonner sur le nom et l'adresse. Or le nom change de casse, d'abréviation, de forme juridique, et prend des fautes de frappe. L'adresse bouge à chaque déménagement. Rapprocher deux fiches là-dessus, c'est du matching flou, avec ses faux positifs et ses ratés.

Le SIREN, lui, ne bouge pas. Une fois chaque fiche rattachée à son SIREN, le regroupement se fait sur une égalité stricte :

import pandas as pd

# df contient les fiches tiers, avec une colonne siren déjà résolue
# et fiabilisée en amont (entreprise active, bon rattachement).

# Le regroupement porte sur le SIREN, pas sur le nom ni l'adresse.
groupes = df.groupby("siren")

# Une fiche canonique par entreprise réelle.
canonique = groupes.agg(
    raison_sociale=("raison_sociale", "first"),
    nb_fiches_fusionnees=("id_fiche", "count"),
    fiches_source=("id_fiche", lambda s: ",".join(map(str, s))),
).reset_index()

Le groupby est trivial. Tout le travail est en amont : retrouver le bon SIREN à partir de ce qu'on a en base, c'est-à-dire un nom approximatif et une adresse partielle. C'est le problème difficile, et c'est celui qui décide de la qualité du résultat.

Cette approche est le pendant, côté entreprise, de la déduplication par adresse normalisée que je décris dans dédoublonner un fichier client par adresse normalisée. En B2C, la clé pivot est souvent l'adresse plus le nom. En B2B, le SIREN est presque toujours meilleur, parce qu'il porte à lui seul l'identité de l'entreprise.

Un SIREN propre ouvre bien plus que la facture

Un SIREN fiable est une porte d'entrée. Une fois que vous le tenez, vous héritez, depuis des sources publiques officielles, de tout un dossier sur l'entreprise :

  • son activité réelle (code NAF)
  • sa forme juridique
  • sa tranche d'effectifs
  • son état, active ou radiée
  • sa date de création
  • ses dirigeants
  • sa convention collective applicable (IDCC)
  • ses établissements et leur localisation

Le raisonnement déborde largement la facture. Un commercial qui connaît la taille et le secteur d'un prospect le qualifie mieux. Aux RH, l'IDCC donne directement la convention collective à appliquer. En conformité, voir les dirigeants, c'est une étape de connaissance du tiers déjà faite. Tout part du même point : un SIREN juste, rattaché à la bonne entreprise. L'inverse est vrai aussi. Un SIREN faux, et c'est tout le dossier qui est faux.

Les cas limites : les 10 % qu'on oublie toujours

La base SIRENE de l'INSEE recense près de 43 millions d'établissements et 30 millions d'entreprises. Elle est ouverte, officielle et gratuite. Ça ne veut pas dire qu'elle est simple à exploiter, et c'est justement là que se joue la qualité.

Les non-diffusibles. Selon l'INSEE, environ 10 % des unités de la base SIRENE sont non diffusibles. L'entreprise existe, son SIREN est valide, mais l'INSEE masque une partie des informations, en général le nom et l'adresse. Ce sont souvent des entrepreneurs individuels qui ont demandé à ne pas être exposés. Un outil de fiabilisation qui ignore ce statut conclura « introuvable » sur des tiers parfaitement réels.

Les cessations. Un SIREN radié reste dans la base avec tout son historique. Le retrouver n'est pas la question. Voir qu'il n'est plus actif, c'est ça qui compte pour décider si on peut encore lui adresser une facture.

Les doublons d'enseigne. « Boulangerie Martin », il en existe des centaines en France, sans aucun lien entre elles. Le nom ne discrimine rien. Sans rapprochement sur l'adresse et l'activité, on fusionne deux entreprises qui n'ont rien à voir.

La donnée publique n'est pas magique. Elle est excellente, mais brute. La valeur n'est pas dans le fait d'avoir accès à SIRENE, elle est dans la façon de traiter les cas qui ne rentrent pas dans la case.

La checklist SIREN avant septembre

Six points à vérifier sur vos données tiers avant l'échéance. Aucun n'est un grand chantier ; mis bout à bout, ils font la différence entre des factures qui partent et des factures qui reviennent.

  1. Le SIREN de chaque client est présent. Pas quelque part dans un champ libre : dans un champ dédié, exploitable par une machine.
  2. Il est valide dans sa forme. Neuf chiffres, clé de Luhn correcte. C'est le filtre le plus simple, à faire en premier.
  3. Il correspond à une entreprise active. Un SIREN bien formé peut pointer vers une entité radiée. Vérifiez l'état, pas seulement la forme.
  4. Il pointe sur la bonne entreprise. Un chiffre inversé donne un SIREN valide qui appartient à quelqu'un d'autre. Rapprochez-le du nom et de l'adresse attendus.
  5. Pour vos clients multi-établissements, le bon SIRET. C'est le seul cas où la maille établissement compte pour le routage.
  6. Vous avez un contrôle à la saisie. Corriger une fois ne sert à rien si la fiche suivante entre fausse la semaine d'après.

Pour résumer

La réforme de la facturation électronique transforme le SIREN d'une donnée administrative en clé opérationnelle. Au 1er septembre 2026, il devient une mention obligatoire de la facture et sert d'adresse de routage via l'annuaire central. Un SIREN absent, faux ou rattaché à une entreprise radiée, et la facture n'est pas livrée.

Le même identifiant est aussi la meilleure clé pour dédoublonner une base tiers et la porte d'entrée vers tout l'enrichissement disponible dans SIRENE. Le principe est simple ; la difficulté est de retrouver le bon SIREN à partir de données de saisie imparfaites, et de gérer proprement les cas limites, à commencer par les 10 % d'unités non diffusibles.

C'est exactement le problème que nous préparons chez TrustyData : rendre la base SIRENE de l'INSEE réellement exploitable, y compris à partir de données imparfaites. Le service de recherche entreprise arrive. Si le sujet vous concerne et que vous voulez être prévenu au lancement, l'inscription à la bêta est ouverte.