Pourquoi trouver le SIREN d’un site e-commerce n’est pas trivial

Le SIREN est le numéro d’immatriculation à neuf chiffres délivré par l’INSEE à chaque entreprise française. Il est l’identifiant de référence pour toute vérification légale, KYC ou enrichissement de fichier. Pour les entreprises physiques, le retrouver est relativement simple. Pour une boutique en ligne, c’est une autre histoire.

Deux approches intuitives reviennent souvent — et toutes les deux sont fausses.

Le piège de l’adresse IP

Le premier réflexe est de résoudre l’IP du serveur qui héberge le site, puis de déduire la localisation de l’entreprise à partir de cette IP. Cette méthode est sans valeur pour le e-commerce.

Les boutiques Shopify sont hébergées sur l’infrastructure Shopify (Fastly, AWS) dont les serveurs sont localisés aux États-Unis, au Canada ou en Europe selon la région CDN assignée — sans aucun lien avec le pays d’implantation du commerçant. Il en va de même pour Wix, Squarespace, ou toute solution SaaS. Une boutique WooCommerce hébergée chez un prestataire mutualisé partage son IP avec des centaines d’autres sites. Une IP ne localise qu’une machine, jamais une entreprise.

Le piège des mentions textuelles

La deuxième approche consiste à chercher une ville ou une adresse mentionnée sur le site (page « Contact », footer, etc.) et à s’en servir pour identifier l’entreprise. Le problème : une mention de « Paris » ou « 15 rue X, 75001 » ne garantit pas l’existence réelle de l’entreprise à cette adresse. Cette méthode expose à des erreurs d’identification, à des scénarios de fraude et à des failles KYC sérieuses.

Par ailleurs, de nombreuses entreprises opérant sur le marché français sont des entités étrangères disposant uniquement d’un numéro de TVA intracommunautaire pour collecter et reverser la TVA à l’État français. Ces sociétés n’ont pas de SIREN — et doivent être identifiées comme telles pour éviter des erreurs de ciblage ou de conformité.

La méthode manuelle : mentions légales + INPI

La seule approche manuelle fiable consiste à exploiter les mentions légales du site. En France, tout site commercial a l’obligation légale d’afficher ses mentions légales, qui doivent inclure la raison sociale, l’adresse du siège et le numéro SIRET ou SIREN.

  1. Naviguer vers le site cible et localiser le lien vers les mentions légales (généralement dans le footer).
  2. Extraire le numéro SIRET ou SIREN mentionné dans la page.
  3. Croiser ce numéro avec le registre de l’INPI ou un agrégateur comme Pappers pour vérifier que l’entité est bien active et établie en France.

Cette méthode fonctionne — mais elle est non scalable. Sur un seul site, elle prend 3 à 5 minutes. Sur un fichier de 10 000 URLs, elle représente plusieurs centaines d’heures de travail manuel. Elle se heurte également à des limites pratiques : certains sites n’affichent pas leurs mentions légales, d’autres les noient dans des PDF inaccessibles, et certains domaines redirigent vers un autre domaine principal que vous n’avez pas identifié.

Le processus automatisé lebot.in : 4 étapes

lebot.in automatise ce processus de bout en bout, avec une couche de validation supplémentaire que la méthode manuelle ne permet pas d’effectuer systématiquement.

Étape 1 — Vérification du domaine de destination

Avant toute analyse, le système vérifie que le domaine soumis est bien un domaine de destination et non un domaine de redirection. Un domaine qui redirige vers un autre (marque.comboutique-marque.fr) doit être traité sur sa destination réelle, pas sur l’alias. Sans cette étape, on travaille sur le mauvais domaine.

Étape 2 — Extraction des pages légales

Un script parcourt le header et le footer du site à la recherche des liens vers les mentions légales, les CGV et les CGU. Il récupère l’intégralité des pages disponibles — les trois si elles existent, ou les seules présentes le cas échéant. Cette approche multi-sources augmente significativement le taux de détection : le SIREN peut figurer dans les CGV sans apparaître dans les mentions légales, ou inversement.

Étape 3 — Détection du SIRET/SIREN par IA

Le contenu récupéré est transmis à un modèle d’IA entraîné à détecter les numéros d’immatriculation dans des textes juridiques français. L’IA distingue automatiquement le SIRET (14 chiffres) du SIREN (9 chiffres), gère les variantes de formatage et écarte les faux positifs (numéros de TVA, codes APE, références de contrat).

Étape 4 — Croisement avec l’INPI

Le numéro détecté est croisé avec les données de l’INPI. Cette étape remplit trois fonctions : confirmer que l’entité est active (et non en liquidation ou radiée), vérifier que son siège social est bien situé en France, et écarter les entreprises étrangères qui n’ont qu’un numéro de TVA sans immatriculation française.

Le résultat : à partir d’une URL, on obtient un SIREN vérifié, actif, rattaché à une entité réellement établie en France — et non une simple correspondance textuelle non validée.

Pourquoi cette approche est plus fiable que les alternatives

Elle vérifie la réalité juridique, pas une apparence. Le SIRET/SIREN croisé avec l’INPI prouve l’existence légale de l’entreprise. On ne se fie pas à un affichage déclaratif — une ville citée en pied de page — mais à une source officielle et opposable.

Elle s’appuie sur la bonne donnée de localisation. La localisation est tirée du siège social déclaré, et non de l’IP serveur. C’est la seule donnée qui ait un sens juridique et commercial.

Elle filtre en amont, pas en aval. La vérification intervient avant la mise en campagne ou l’intégration dans un CRM. On ne découvre pas après coup, à l’usage, que la cible était hors périmètre.

Elle neutralise les faux positifs structurels. Domaines de redirection, hébergement SaaS mutualisé, numéros de TVA intracommunautaire d’entreprises étrangères : autant de pièges que le croisement officiel élimine méthodiquement.

Ce que les autres process ratent — et ce que ça coûte

La localisation par IP serveur produit une base fausse par construction

Une base qui localise les e-commerçants par IP de serveur classe des milliers d’entreprises françaises comme étrangères, et inversement. Ce n’est pas un problème de qualité marginale : c’est une erreur structurelle qui touche tous les sites sur SaaS (Shopify, Wix, Squarespace) — soit près d’un tiers du marché e-commerce français selon les données lebot.in de juin 2026.

Un mauvais ciblage géographique abîme la réputation de domaine

Un message en français envoyé à un destinataire hors cible est un mail non pertinent. Non-pertinence équivaut à signaux négatifs : non-ouvertures, signalements spam, hard bounces. Ces signaux dégradent la réputation de l’expéditeur et pénalisent toutes les campagnes qui suivent, y compris celles correctement ciblées. Le mauvais ciblage d’aujourd’hui plombe la délivrabilité de demain.

Les bases non vérifiées cumulent les risques techniques

Une base sans vérification empile adresses mortes, pièges à spam et contacts obsolètes. Chaque envoi sur ces adresses fait monter le taux de bounce — le critère que les FAI surveillent en priorité pour décider si vos mails arrivent en boîte de réception ou en spam.

Ne pas vérifier l’existence de l’entreprise ouvre la porte aux scams

Sans contrôle KYC, rien ne distingue un e-commerçant réel d’une coquille montée pour le temps d’une arnaque. Cibler ces entités, c’est perdre du budget — mais aussi potentiellement s’associer à des acteurs frauduleux dans vos flux logistiques, de paiement ou de marketplace.

L’absence de vérification fausse toute la mesure de performance

Si la base contient 20 % de cibles hors périmètre, tous les taux — ouverture, clic, conversion — sont mécaniquement tirés vers le bas. On pilote sur des chiffres faux et on prend de mauvaises décisions d’optimisation. La vérification en amont n’est pas un coût : c’est une condition pour que les données de performance aient un sens.

Qui a besoin d’identifier le SIREN d’une boutique en ligne ?

Opérateurs de marketplace (KYB et DAC7)

La réglementation DAC7, en vigueur depuis 2023, impose aux opérateurs de marketplace de collecter et de vérifier les informations légales de leurs vendeurs. Identifier le SIREN à partir du site web d’un vendeur est une étape clé du KYB : cela permet de rattacher le compte marketplace à une entité légale vérifiable, et de détecter les entités étrangères qui ne sont pas soumises aux mêmes obligations.

Équipes commerciales B2B ciblant le e-commerce

Pour prospecter des boutiques en ligne, un fichier de domaines n’est pas suffisant : il faut les SIREN pour dédupliquer (certaines entreprises gèrent plusieurs domaines), enrichir avec les données du registre (taille, chiffre d’affaires, dirigeant), et s’assurer que les entreprises ciblées sont bien des entités françaises actives.

Logisticiens et prestataires de paiement

Avant d’intégrer un nouveau marchand, vérifier son identité légale est une étape standard de due diligence. Le SIREN permet de croiser avec les scores de solvabilité, les procédures collectives en cours et l’historique juridique de l’entreprise.

Analystes et équipes M&A

Construire un univers de cibles d’acquisition e-commerce nécessite de rattacher chaque domaine à son entité légale. Sans SIREN, il est impossible de croiser avec les données financières officielles disponibles via l’INPI ou Infogreffe.

Identifier le SIREN d’un site e-commerce avec lebot.in

L’outil URL-to-SIREN de lebot.in automatise les quatre étapes décrites ci-dessus. Il est disponible en utilisation unitaire (une URL à la fois) et en mode batch pour des fichiers de plusieurs milliers d’URLs.

Accéder à l’outil URL-to-SIREN →

Pour les équipes qui souhaitent intégrer l’identification de SIREN dans leur stack (CRM, plateforme de prospection, système KYB), une API est disponible. Réserver un appel de 30 min →

Questions fréquentes

Comment trouver le SIREN d’un site web manuellement ?

Naviguez vers les mentions légales du site (lien généralement présent dans le footer). Le SIREN ou SIRET y est obligatoirement mentionné pour les entreprises françaises. Croisez ensuite ce numéro avec l’INPI ou Pappers pour vérifier l’entité. Cette méthode fonctionne sur un site unique mais n’est pas scalable.

Peut-on trouver le SIREN d’un site via son adresse IP ?

Non. L’adresse IP du serveur ne reflète pas l’identité de l’entreprise. Sur Shopify ou toute solution SaaS, l’IP appartient à l’infrastructure de la plateforme, pas au marchand. Cette méthode produit des résultats sans valeur pour identifier une entreprise.

Quelle est la différence entre SIRET et SIREN ?

Le SIREN (9 chiffres) identifie l’entreprise. Le SIRET (14 chiffres) identifie un établissement spécifique (siège, entrepôt, magasin…). Pour identifier une entreprise e-commerce, le SIREN est l’identifiant pertinent ; le SIRET est utile si vous avez besoin de localiser un établissement précis.

Que faire si un site n’a pas de mentions légales ?

L’absence de mentions légales est une infraction pour tout site commercial français. En pratique, cela peut indiquer une entité étrangère non immatriculée en France, un micro-entrepreneur négligent, ou un site fantôme. Le système lebot.in détecte cette absence et la signale — ce qui est lui-même un signal de qualification utile.

Peut-on identifier le SIREN d’une boutique Shopify ou WooCommerce ?

Oui, sous réserve que le site affiche des mentions légales. La plateforme CMS n’a aucune incidence sur la détection : qu’il s’agisse de Shopify, WooCommerce, PrestaShop ou toute autre solution, le processus analyse les pages légales du site, pas son infrastructure technique.