Glossaire IA 2026 : 60+ termes essentiels pour comprendre l'IA souveraine en entreprise
Ce glossaire rassemble les termes-clés que tout dirigeant, DSI, DPO et collaborateur d'entreprise doit comprendre pour aborder un projet d'IA souveraine en 2026. Définitions courtes (40-80 mots), sans jargon inutile, mises à jour des évolutions techniques et réglementaires récentes (modèles 2024-2026, AI Act applicable). Organisé en 6 thèmes : Fondamentaux IA, Modèles et LLM, Déploiement et infrastructure, Applications IA en entreprise, Conformité AI Act et RGPD, Aides publiques et financement.
1. Fondamentaux IA
Intelligence artificielle (IA)
Système informatique capable de produire une sortie pertinente (texte, image, prédiction, décision) à partir d'une entrée donnée, en utilisant un apprentissage statistique sur des données plutôt qu'une règle programmée. L'AI Act la définit comme « un système conçu pour fonctionner avec différents niveaux d'autonomie qui peut faire preuve de capacités d'adaptation après le déploiement ».
IA souveraine
Désigne une IA dont les modèles, l'infrastructure et les données restent sous contrôle européen ou français. Concrètement : modèles open-source européens (Mistral) ou ouverts (Llama, Qwen) déployés sur infrastructure on-premise ou cloud souverain français qualifié SecNumCloud, sans transit par les hyperscalers américains ou chinois.
IA générative
Sous-famille d'IA spécialisée dans la production de contenu nouveau (texte, image, code, audio) à partir d'une instruction utilisateur (prompt). Les grands modèles de langage (LLM) sont la forme la plus visible d'IA générative en 2026.
Prompt
Instruction textuelle donnée à un modèle d'IA générative pour orienter sa sortie. Un prompt bien construit (clair, contextualisé, avec exemples) améliore significativement la qualité de la réponse. L'ingénierie de prompt (prompt engineering) est devenue une compétence métier à part entière depuis 2023.
Hallucination IA
Production par un modèle d'IA d'une réponse fausse ou inventée, présentée avec assurance. C'est l'un des risques principaux des LLM en usage métier. Les techniques de mitigation incluent RAG (ancrage sur sources), surveillance humaine, et limitation de la latitude créative du modèle.
Entraînement (training)
Phase d'apprentissage d'un modèle d'IA à partir de données. Trois phases distinctes : pré-entraînement (sur grandes quantités de texte non labellisé), fine-tuning (sur données spécifiques labellisées), et alignement (RLHF ou DPO) pour orienter les réponses vers ce qui est socialement acceptable.
Dataset
Ensemble de données utilisé pour entraîner ou évaluer un modèle d'IA. Pour un projet IA en entreprise, le dataset propre (documents internes, historique métier) est souvent ce qui fait la différence entre un projet réussi et un projet médiocre.
Biais algorithmique
Distorsion systématique d'un modèle d'IA reproduisant les déséquilibres présents dans les données d'entraînement. Cause majeure de risque éthique et juridique (discrimination en RH, en assurance, en crédit). L'AI Act impose la surveillance des biais sur les usages haut risque (article 10).
2. Modèles et LLM
LLM (Large Language Model)
Modèle de langage de grande taille entraîné sur des milliards de mots pour comprendre et générer du texte en langage naturel. Représenté en 2026 par Mistral, Llama, Qwen, GPT, Claude, Gemini, DeepSeek. Les LLM sont la brique de base de la majorité des applications IA d'entreprise.
GPAI (General-Purpose AI)
Modèle d'IA à usage général au sens de l'AI Act — un modèle de fondation utilisable pour de multiples tâches en aval. Soumis à des obligations spécifiques (art. 53-55) : documentation, transparence sur les données d'entraînement, résumé pour le respect du droit d'auteur. Sanctions article 101 : 15 M€ ou 3 % CA mondial.
Mistral (modèle)
Famille de LLM développée par l'entreprise française Mistral AI depuis 2023. Modèles open-weights principaux : Mistral 7B, Mixtral 8x7B, Mistral Small, Mistral Large. Particulièrement performants en français. C'est le LLM de référence pour l'IA souveraine on-premise en entreprise française.
Llama (modèle)
Famille de LLM open-weights publiée par Meta depuis 2023. Versions principales en 2026 : Llama 3.x à 8B, 70B, 405B paramètres. Disponible librement pour usage commercial sous certaines conditions de licence. Stack IAPRO typique : Llama 3 8B en complément de Mistral 7B.
Qwen (modèle)
Famille de LLM open-weights publiée par Alibaba depuis 2023. Versions 7B, 14B, 32B, 72B. Particulièrement performante en multilingue et en raisonnement. Utilisée en IA souveraine quand un complément non-européen et non-américain est recherché.
DeepSeek (modèle)
Famille de LLM open-weights publiée par DeepSeek depuis 2024, dont les versions DeepSeek V3 et R1 ont marqué le marché par leur excellent ratio performance/coût en inférence. Utilisée pour des cas d'usage de raisonnement et de code.
Paramètres (du modèle)
Variables internes d'un modèle d'IA ajustées pendant l'entraînement. Un modèle « 7B » a 7 milliards de paramètres ; un « 70B » en a 70 milliards. Plus de paramètres = capacités supérieures mais coût d'inférence proportionnellement plus élevé. La majorité des cas d'usage entreprise sont bien servis par les 7-14B.
Fenêtre de contexte
Quantité de texte qu'un modèle peut traiter en une seule requête (entrée + sortie). Mesurée en tokens. En 2026, les modèles standards offrent 32K à 200K tokens, certains spécialisés jusqu'à 1M+ tokens (Claude, DeepSeek long context, Mistral Large). Détermine la capacité à traiter de longs documents.
Token
Unité de découpage du texte pour un LLM (généralement ~3-4 caractères français). « IAPRO déploie l'IA » = ~7-9 tokens. Les coûts d'inférence des API LLM sont facturés au token. Sur des modèles locaux, un token consomme du temps GPU mesurable mais sans facturation à l'usage.
Fine-tuning
Adaptation d'un modèle pré-entraîné à une tâche ou un domaine spécifique en l'exposant à un dataset ciblé. Variantes : full fine-tuning (tous les paramètres), LoRA / QLoRA (adaptateurs légers). Pour IAPRO, le fine-tuning sert à adapter le modèle au vocabulaire et au style du métier client.
LoRA (Low-Rank Adaptation)
Technique de fine-tuning efficace qui ajoute de petites matrices « adaptateurs » au modèle au lieu de modifier tous ses paramètres. Permet d'adapter un modèle 7B avec quelques GB de VRAM et quelques heures de calcul (vs des centaines avec un full fine-tuning). Standard de fait en 2026.
Quantization
Technique de compression d'un modèle d'IA réduisant la précision numérique de ses paramètres (de FP32 vers FP16, INT8, INT4). Diminue la VRAM requise et accélère l'inférence avec une perte de qualité contrôlée. Une RTX 4060 Ti 16 GB peut faire tourner un modèle 13B en INT4 grâce à la quantization.
Embedding
Représentation vectorielle d'un texte (ou d'une image) dans un espace mathématique multi-dimensionnel. Deux textes proches sémantiquement ont des embeddings proches géométriquement. Brique fondamentale du RAG. Modèles populaires : nomic-embed-text, BGE, multilingual-e5.
Modèle de fondation
Modèle d'IA pré-entraîné à très grande échelle, conçu pour servir de base à de multiples applications en aval via prompt ou fine-tuning. Les LLM modernes sont des modèles de fondation. L'AI Act les qualifie de GPAI quand leurs capacités sont génériques.
3. Déploiement et infrastructure
On-premise
Déploiement d'un système (ici, un LLM) sur les serveurs physiques du client, dans ses locaux, sans connexion internet sortante requise. C'est le mode privilégié IAPRO pour garantir la souveraineté des données. À distinguer du cloud (déploiement chez un prestataire externe) et du SaaS (logiciel hébergé chez l'éditeur).
Cloud souverain
Infrastructure cloud opérée par un acteur européen ou français, qualifiée par l'ANSSI (SecNumCloud) ou équivalent, garantissant que les données ne sortent pas du périmètre juridique européen. Acteurs en 2026 : OVHcloud, Outscale, Iliad/Scaleway, S3NS (Thales/Google fork), Bleu (Microsoft/Capgemini/Orange).
Ollama
Logiciel open-source qui simplifie le téléchargement, la mise à jour et l'exécution de LLM open-weights sur un serveur local. Compatible Mac/Linux/Windows, GPU NVIDIA/AMD/Apple Silicon. Stack standard IAPRO pour servir les modèles aux applications client.
OpenWebUI
Interface web open-source pour interagir avec des LLM locaux (typiquement servis par Ollama). Fonctionnalités : conversations, comparaison de modèles, RAG documentaire, multi-utilisateurs avec gestion fine des permissions. Stack IAPRO standard pour l'expérience utilisateur en entreprise.
RAG (Retrieval Augmented Generation)
Architecture qui combine une base documentaire indexée (vector store) avec un LLM. À chaque question, le système récupère les passages pertinents et les injecte dans le prompt. Résout l'hallucination en ancrant les réponses sur des sources. Brique critique IAPRO pour les déploiements RAG documentaire.
Base vectorielle (vector DB)
Base de données spécialisée dans le stockage et la recherche d'embeddings. Permet de retrouver rapidement les documents les plus proches sémantiquement d'une question. Outils 2026 : Qdrant, pgvector, Chroma, Weaviate, Milvus. IAPRO déploie Qdrant ou pgvector selon configuration.
GPU (Graphics Processing Unit)
Processeur spécialisé dans le calcul parallèle massif, fondamental pour faire tourner les LLM. Les modèles entreprise tournent sur RTX 4060 Ti 16 GB (pack Starter), RTX 5090 32 GB (pack Pro), H100 80 GB ou 2× RTX 5090 (pack Entreprise) selon la taille du modèle et le nombre d'utilisateurs simultanés.
VRAM
Mémoire graphique embarquée sur le GPU, déterminante pour la taille du modèle LLM exécutable. Repère : un modèle 7B en quantization INT4 nécessite ~4-6 GB de VRAM ; un 70B en INT4 nécessite ~40 GB ; un 70B en FP16 nécessite ~140 GB.
Inférence
Phase d'utilisation d'un modèle déjà entraîné pour produire une sortie à partir d'une entrée. C'est l'usage opérationnel quotidien (vs l'entraînement, événement ponctuel). La latence d'inférence (temps de réponse) est un KPI critique pour l'UX, mesuré en tokens/seconde.
Latence
Temps écoulé entre l'envoi d'une requête et l'obtention de la réponse. Pour un LLM local sur GPU récent, la latence pour les premiers tokens est typiquement < 1 seconde, puis la génération continue à 30-100 tokens/seconde selon le modèle et le GPU.
Docker
Plateforme de containerisation logicielle permettant de packager un environnement complet (modèles, code, dépendances) dans une image autonome reproductible. IAPRO livre ses installations via une image Docker pré-buildée, ce qui garantit installation rapide et homogénéité entre clients.
Tailscale
Réseau VPN moderne basé sur WireGuard, utilisé par IAPRO pour le support distant chiffré des installations clients. Permet à IAPRO d'intervenir sur autorisation explicite uniquement, sans ouvrir de port public ni risquer une exposition réseau.
4. Applications IA en entreprise
Agent IA
Système IA combinant un LLM avec des outils (recherche web, API métier, code execution, lecture/écriture de fichiers) pour exécuter des tâches multi-étapes de manière autonome. Les agents IAPRO sont déployés via n8n + LLM local + connecteurs personnalisés (RAG documentaire, ERP, CRM, GED).
MCP (Model Context Protocol)
Protocole ouvert proposé par Anthropic en 2024 et adopté largement en 2025-2026, permettant aux LLM d'accéder de façon standardisée à des sources de données et outils externes. Brique d'intégration émergente pour les agents IA en entreprise.
n8n
Plateforme open-source d'automatisation de workflows. Permet de connecter LLM, ERP, CRM, base de données, API tierces dans des séquences logiques. IAPRO utilise n8n comme orchestrateur d'agents IA en entreprise — alternative locale aux automatismes type Zapier/Make/Power Automate.
Chatbot
Interface conversationnelle, généralement web ou messaging, permettant à un utilisateur d'interagir en langage naturel avec un système IA. AI Act art. 50 impose l'identification claire d'un chatbot comme IA dès la première interaction.
Copilote IA
IA d'assistance intégrée à un outil métier (CRM, IDE, suite bureautique) qui propose des suggestions contextuelles à l'utilisateur. Microsoft 365 Copilot, GitHub Copilot, etc. La variante souveraine consiste à intégrer un LLM local dans les outils métier avec l'API du logiciel.
Computer vision
Branche de l'IA spécialisée dans l'analyse d'images et vidéos : détection d'objets, classification, segmentation, lecture de plaques, reconnaissance optique de caractères (OCR). En industrie : contrôle qualité visuel automatisé. En BTP : détection EPI sur chantier.
OCR (Optical Character Recognition)
Technologie de reconnaissance des caractères dans une image ou un PDF scanné. Combinée à un LLM, l'OCR moderne permet d'extraire structuration et sémantique des documents (factures, contrats, formulaires). Stack IAPRO : Tesseract local, ou modèles OCR multimodaux (Mistral OCR, Qwen-VL).
Dictée vocale IA
Transcription en temps réel de la voix en texte structuré. En cabinet médical, en justice, en gestion d'actes : gain massif de temps de saisie. Stack IAPRO : Whisper open-source en local, ou modèles spécialisés métiers.
Orchestration multi-agent
Architecture où plusieurs agents IA spécialisés collaborent sur une tâche complexe (un agent recherche, un agent rédige, un agent valide). Cadre 2026 : frameworks LangGraph, CrewAI, AutoGen. IAPRO déploie des orchestrations multi-agents sur des cas d'usage avancés (due diligence, audit conformité, recherche multi-source).
5. Conformité AI Act et RGPD
AI Act (Règlement UE 2024/1689)
Règlement européen sur l'IA adopté en mai 2024, applicable progressivement entre février 2025 et août 2027. Encadre la mise sur le marché et l'usage des systèmes d'IA dans l'Union européenne avec une approche par les risques (inacceptable, haut, limité, minimal).
Annexe III
Annexe de l'AI Act listant les usages d'IA classés haut risque, soumis aux obligations renforcées des articles 16+. 8 domaines : biométrie, infrastructures critiques, éducation, emploi (RH/recrutement), accès aux services essentiels, application de la loi, migration, justice. Détail dans notre page dédiée.
Article 5 — pratiques interdites
Liste les usages d'IA strictement interdits dans l'Union : manipulation comportementale exploitant des vulnérabilités, social scoring, reconnaissance biométrique en espace public à des fins répressives en temps réel, reconnaissance d'émotions sur le lieu de travail, profilage prédictif d'infraction, etc. Sanctions Tier 1 : 35 M€ ou 7 % CA mondial.
Article 50 — transparence
Impose l'identification claire des systèmes IA dans certaines situations : chatbot (dès la première interaction), contenu généré ou substantiellement modifié par IA (texte, image, audio, vidéo), reconnaissance des émotions, catégorisation biométrique, deepfakes commerciaux.
Fournisseur (provider)
Entité qui développe ou commercialise sous son nom un système d'IA. Obligations les plus lourdes : système de gestion de la qualité, documentation technique annexe IV, déclaration UE, surveillance post-commercialisation, marquage CE.
Déployeur (deployer)
Entité qui utilise un système d'IA sous sa propre autorité dans le cadre d'une activité professionnelle. La majorité des entreprises clientes IAPRO sont déployeurs (et pas fournisseurs). Obligations art. 26 : surveillance humaine, information des personnes concernées, conformité d'usage.
Importateur
Entité de l'UE qui met sur le marché européen un système d'IA en provenance d'un fournisseur établi hors UE. Vérification de conformité documentaire avant mise en marché (art. 23).
Distributeur
Entité de la chaîne d'approvisionnement, autre que fournisseur et importateur, qui met à disposition un système d'IA sur le marché (art. 24). Obligations de vérification documentaire de base.
Article 4 — maîtrise de l'IA
Obligation pour toute organisation déployant l'IA de garantir un niveau suffisant de « maîtrise de l'IA » chez son personnel concerné. Applicable depuis le 2 août 2026. Implique formation documentée + charte d'usage + procédure de signalement.
Article 14 — supervision humaine
Obligation pour les systèmes haut risque de garantir une supervision humaine effective pendant leur utilisation. La personne doit pouvoir comprendre la sortie de l'IA, vérifier sa pertinence, et la modifier ou ignorer si nécessaire.
AIPD (Analyse d'impact relative à la protection des données)
Document obligatoire au titre du RGPD (art. 35) pour tout traitement de données personnelles à haut risque. L'usage d'une IA traitant des données personnelles à grande échelle déclenche presque toujours une AIPD. CNIL publie un modèle officiel.
FRIA (Fundamental Rights Impact Assessment)
Analyse d'impact sur les droits fondamentaux exigée par l'AI Act art. 27 pour certains usages haut risque dans le secteur public et certains secteurs privés (banque, assurance, éducation, RH). Complète l'AIPD RGPD sur les dimensions non strictement « données personnelles ».
RGPD
Règlement (UE) 2016/679 sur la protection des données personnelles, applicable depuis mai 2018. Couvre tous les traitements de données identifiantes. Sanctions max : 20 M€ ou 4 % CA mondial. Cumul possible avec sanctions AI Act sur un même fait.
CNIL
Commission Nationale de l'Informatique et des Libertés — autorité française de contrôle du RGPD. Sera également l'une des autorités compétentes pour l'AI Act sur les volets données personnelles, en coordination avec les autorités sectorielles (ACPR, AMF, etc.).
DORA
Règlement (UE) 2022/2554 sur la résilience opérationnelle numérique du secteur financier. Applicable depuis janvier 2025. Impose aux banques, assureurs, prestataires de services de paiement la maîtrise de leurs risques numériques, y compris IA et tiers technologiques critiques.
HDS (Hébergement de Données de Santé)
Certification française obligatoire pour héberger des données de santé en cloud externe (art. L. 1111-8 du code de la santé publique). Liste des hébergeurs certifiés HDS publiée par l'ASIP Santé / ANS. Indispensable pour les déploiements IAPRO en cabinet médical ou hospitalier en mode cloud.
6. Aides publiques et financement
Diag Data IA Bpifrance
Diagnostic stratégique IA financé partiellement par Bpifrance. 13 000 € HT mission, 42 % pris en charge, reste à charge 7 500 € HT. Détails sur notre page dédiée.
IA Booster France 2030
Dispositif France 2030 piloté par DGE/Bpifrance, en deux phases. Phase 1 : pilote, 13 000 € HT, jusqu'à 80 % PEC. Phase 2 : industrialisation, 60 000 € HT, 50 % PEC. Phase 1 · Phase 2.
France Num
Plateforme nationale d'accompagnement à la transformation numérique des TPE-PME. Pilote le Pack IA Francenum (37 000 € HT projet, 50 % PEC), accessible aux structures sous le seuil PME 250 sal. Annuaire Activateurs France Num référence les prestataires.
ADEN HDF
Aide au Développement Économique Numérique de la Région Hauts-de-France. PME ≤ 20 ETP, CA < 2 M€. 40 % de prise en charge, plafond 12 000 € de subvention. Détails.
INAC HDF
Initiative Numérique Artisans-Commerçants des Hauts-de-France. Équivalent ADEN pour les artisans-commerçants individuels (EI/EIRL/micro). Détails.
CIR (Crédit d'Impôt Recherche)
Crédit d'impôt 30 % sur dépenses R&D éligibles, plafond 100 M€/an. Applicable au fine-tuning, développement d'algorithmes propriétaires, R&D IA. Hors minimis. Détails.
CII (Crédit d'Impôt Innovation)
Crédit d'impôt 20 % réservé aux PME < 250 sal., sur prototypes et procédés innovants. Plafond 400 K€ de dépenses/an. Hors minimis. Détails.
OPCO
Opérateur de Compétences. 11 OPCO en France, chacun couvrant des branches professionnelles. Finance la formation continue des salariés. Pour l'IA : Atlas (services financiers), 2i (industrie), Constructys (BTP), et autres selon branche.
FIF-PL
Fonds Interprofessionnel de Formation des Professionnels Libéraux. Finance la formation IA des libéraux non-salariés (avocats, médecins, comptables libéraux, architectes). Détails.
ANDPC
Agence Nationale du Développement Professionnel Continu. Finance la formation continue des professionnels de santé conventionnés. Pour les médecins libéraux, alternative ou complément au FIF-PL sur des formations DPC certifiées.
Minimis (plafond)
Plafond européen d'aides d'État autorisées par entreprise sur 3 exercices fiscaux glissants, fixé à 300 000 € depuis 2024. Cumul des aides publiques en deçà du plafond, sauf exceptions (crédits d'impôt CIR/CII hors minimis).
RGEC
Règlement Général d'Exemption par Catégorie de l'Union européenne. Fixe les taux maximaux d'aides d'État selon la taille de l'entreprise (petite, moyenne, grande), la nature du projet et la zone géographique. Cadre dans lequel s'inscrivent les aides IA françaises.
Qualiopi
Certification obligatoire des organismes de formation depuis 2022 pour bénéficier de financements publics (CPF, OPCO, FIF-PL, Pôle Emploi). Tout prestataire formation IA accepté en PEC OPCO doit être Qualiopi.
Rescrit fiscal
Procédure permettant à une entreprise de demander à l'administration fiscale (ou au MESR pour le CIR) une prise de position formelle préalable sur l'éligibilité d'un projet à un dispositif. Réponse dans un délai de 3 mois ; silence vaut acceptation. Recommandé pour sécuriser un CIR/CII IA.
Un terme manque ou n'est pas clair ?
Ce glossaire est mis à jour régulièrement avec les évolutions techniques et réglementaires. Si vous voulez approfondir un sujet ou cadrer un projet IA souveraine pour votre entreprise, échangeons 30 minutes en visio.