Connecteur OCR
Pour permettre le traitement de fichiers non structurés tels que des fichiers PDF ou des images, Data Capture intègre une connectivité native avec des plateformes de reconnaissance optique de caractères (OCR).
L’utilisation de ces services nécessite la création préalable d’un compte utilisateur auprès du fournisseur OCR sélectionné.
Mindee
Pour connecter Data Capture à l’API de Mindee, procédez comme suit :
- Création du compte et récupération de la clé API
-
Inscrivez-vous sur la plateforme Mindee (Sign Up) afin de créer un compte.
-
Une fois connecté, récupérez votre clé secrète dans la section Mindee API Keys.
- Présentation des API disponibles
Mindee propose plusieurs APIs adaptées à permettant l’extraction de données à l’aide de son moteur OCR. Voici quelques types de documents pris en charge :
-
Invoices (factures)
-
Expenses (notes de frais)
-
Receipts (tickets de caisse)
-
ID Documents (pièces d’identité, passeports)
Chaque API dispose de sa propre documentation, qui précise notamment :
-
La version de l’API que vous utilisez
-
Les endpoints pour effectuer les appels API
Ensuite, au niveau du compte Mindee, vous pouvez ajouter les configurations de votre Document API comme suit :
-
Allez dans Capture de données → Configuration → Mindee → Comptes Mindee.
-
Cliquez sur “Ajouter un compte” pour configurer un nouveau compte Mindee.
-
Saisissez la clé API secrète obtenue sur la plateforme Mindee.
-
Sélectionnez le type de document que vous souhaitez traiter (par exemple, Invoices, Expenses, etc.).
-
Indiquez la version de l'API ainsi que l’endpoint correspondant à ce document.
Il est également possible de définir une API Mindee par défaut, qui sera automatiquement utilisée lors de la génération d’un modèle (template) via cette plateforme.
Schema Mindee
Dans certains cas, les données fournies par Mindee peuvent être structurées de manière imbriquée, c’est-à-dire qu’une valeur attendue peut se trouver à l’intérieur d’un sous-élément.
- Exemple : Devise
Dans l’extrait JSON ci-dessous, la devise est intégrée dans l’attribut “currency”, lui-même inclus dans le sous-élément “locale”.
Pour que Data Capture identifie et extraie le code devise correctement, il est nécessaire de spécifier le niveau de profondeur des données à l’aide de l’opérateur $.
Ainsi, pour accéder à la valeur de la devise dans cette structure, on utilisera la notation locale$currency, permettant de cibler directement la valeur "EUR".
Par ailleurs, certaines données dans les réponses Mindee peuvent être présentées sous forme de listes — c’est notamment le cas des lignes d’une facture.
Dans ce type de structure, une extraction correcte des données des lignes nécessite l’introduction d’un élément parent unique, servant de regroupement cohérent pour l’ensemble des éléments de la liste.
Par exemple, dans Data Capture, il est possible de définir un groupe d'éléments qui représente l’ensemble des lignes de la facture. Cela permet de traiter chaque ligne de manière individuelle tout en les associant à leur document principal.
- Exemple : Lignes de facture
Dans Data Capture, on peut définir un groupe nommé (par exemple ligne_items) pour représenter l’ensemble des lignes. Ce groupe agit comme conteneur parent, structurant les lignes de manière logique. Cela permet d’isoler chaque ligne individuellement tout en la liant au document d’origine.
L’accès aux données de ligne s’effectue ensuite via ligne_items, ce qui facilite leur exploitation et le mappage vers Axelor Open Suite.
Paramètres de capture – Mindee
Lors de la configuration des paramètres de capture pour l’intégration avec Mindee, deux éléments essentiels doivent être définis :
-
Compte Mindee : ce paramètre permet l’authentification et l’établissement de la connexion avec la plateforme Mindee. Il garantit un accès sécurisé aux services d’extraction documentaire.
-
Document API : ce paramètre spécifie le modèle d’analyse documentaire à utiliser. Chaque modèle correspond à un type de document (facture, reçu, pièce d’identité, etc.) et oriente le traitement appliqué lors de l’extraction des données.
Ces deux paramètres sont ensuite exploités par le modèle Data Capture, qui utilise ces informations pour se connecter à l’API Mindee, analyser le document transmis, appliquer le moteur OCR approprié, puis extraire les données structurées à partir de celui-ci.
Modèle Data Capture – Mindee
À la suite de l’extraction des données effectuée via l’API Mindee, le modèle Data Capture joue un rôle central dans le processus de vérification des données.
Il permet notamment de déboguer les informations extraites en enregistrant la réponse brute renvoyée par Mindee. Cette réponse est automatiquement stockée dans le modèle, ce qui offre une transparence totale sur les données capturées. Cette fonctionnalité facilite ainsi :
-
l’analyse des données extraites ;
-
la détection d’éventuelles anomalies ou imprécisions ;
-
la validation des informations avant leur exploitation ou transformation par la suite dans les processus métier.