Aller au contenu principal
Version: 8.2

Connecteur OCR

Pour permettre le traitement de fichiers non structurés tels que des fichiers PDF ou des images, Data Capture intègre une connectivité native avec des plateformes de reconnaissance optique de caractères (OCR).

L’utilisation de ces services nécessite la création préalable d’un compte utilisateur auprès du fournisseur OCR sélectionné.

1.1. Connecteur OCR.
1.1. Connecteur OCR.

Mindee

Pour connecter Data Capture à l’API de Mindee, procédez comme suit :

  1. Création du compte et récupération de la clé API
  • Inscrivez-vous sur la plateforme Mindee (Sign Up) afin de créer un compte.

  • Une fois connecté, récupérez votre clé secrète dans la section Mindee API Keys.

  1. Présentation des API disponibles

Mindee propose plusieurs APIs adaptées à permettant l’extraction de données à l’aide de son moteur OCR. Voici quelques types de documents pris en charge :

  • Invoices (factures)

  • Expenses (notes de frais)

  • Receipts (tickets de caisse)

  • ID Documents (pièces d’identité, passeports)

Chaque API dispose de sa propre documentation, qui précise notamment :

  • La version de l’API que vous utilisez

  • Les endpoints pour effectuer les appels API

1.1. La version & Endpoint name.
1.1. La version & Endpoint name.

Ensuite, au niveau du compte Mindee, vous pouvez ajouter les configurations de votre Document API comme suit :

  1. Allez dans Capture de données → Configuration → Mindee → Comptes Mindee.

  2. Cliquez sur “Ajouter un compte” pour configurer un nouveau compte Mindee.

  3. Saisissez la clé API secrète obtenue sur la plateforme Mindee.

1.2. Nom d'utilisateur & Token API.
1.2. Nom d'utilisateur & Token API.
  1. Sélectionnez le type de document que vous souhaitez traiter (par exemple, Invoices, Expenses, etc.).

  2. Indiquez la version de l'API ainsi que l’endpoint correspondant à ce document.

1.3. Document API.
1.3. Document API.
remarque

Il est également possible de définir une API Mindee par défaut, qui sera automatiquement utilisée lors de la génération d’un modèle (template) via cette plateforme.

1.4. Document API (compte Mindee par défaut).
1.4. Document API (compte Mindee par défaut).

Schema Mindee

Dans certains cas, les données fournies par Mindee peuvent être structurées de manière imbriquée, c’est-à-dire qu’une valeur attendue peut se trouver à l’intérieur d’un sous-élément.

  1. Exemple : Devise

Dans l’extrait JSON ci-dessous, la devise est intégrée dans l’attribut “currency”, lui-même inclus dans le sous-élément “locale”.

1.1. JAVA script.
1.1. JAVA script.

Pour que Data Capture identifie et extraie le code devise correctement, il est nécessaire de spécifier le niveau de profondeur des données à l’aide de l’opérateur $.

Ainsi, pour accéder à la valeur de la devise dans cette structure, on utilisera la notation locale$currency, permettant de cibler directement la valeur "EUR".

1.2. La notation locale$currency qui permet de cibler directement la valeur EUR.
1.2. La notation locale$currency qui permet de cibler directement la valeur EUR.

Par ailleurs, certaines données dans les réponses Mindee peuvent être présentées sous forme de listes — c’est notamment le cas des lignes d’une facture.

Dans ce type de structure, une extraction correcte des données des lignes nécessite l’introduction d’un élément parent unique, servant de regroupement cohérent pour l’ensemble des éléments de la liste.

Par exemple, dans Data Capture, il est possible de définir un groupe d'éléments qui représente l’ensemble des lignes de la facture. Cela permet de traiter chaque ligne de manière individuelle tout en les associant à leur document principal.

  1. Exemple : Lignes de facture
1.3. Lignes de facture.
1.3. Lignes de facture.

Dans Data Capture, on peut définir un groupe nommé (par exemple ligne_items) pour représenter l’ensemble des lignes. Ce groupe agit comme conteneur parent, structurant les lignes de manière logique. Cela permet d’isoler chaque ligne individuellement tout en la liant au document d’origine.

L’accès aux données de ligne s’effectue ensuite via ligne_items, ce qui facilite leur exploitation et le mappage vers Axelor Open Suite.

1.4. Sur l'image : line_items.
1.4. Sur l'image : line_items.

Paramètres de capture – Mindee

Lors de la configuration des paramètres de capture pour l’intégration avec Mindee, deux éléments essentiels doivent être définis :

  • Compte Mindee : ce paramètre permet l’authentification et l’établissement de la connexion avec la plateforme Mindee. Il garantit un accès sécurisé aux services d’extraction documentaire.

  • Document API : ce paramètre spécifie le modèle d’analyse documentaire à utiliser. Chaque modèle correspond à un type de document (facture, reçu, pièce d’identité, etc.) et oriente le traitement appliqué lors de l’extraction des données.

Ces deux paramètres sont ensuite exploités par le modèle Data Capture, qui utilise ces informations pour se connecter à l’API Mindee, analyser le document transmis, appliquer le moteur OCR approprié, puis extraire les données structurées à partir de celui-ci.

1.1. Configurations Mindee.
1.1. Configurations Mindee.

Modèle Data Capture – Mindee

À la suite de l’extraction des données effectuée via l’API Mindee, le modèle Data Capture joue un rôle central dans le processus de vérification des données.

Il permet notamment de déboguer les informations extraites en enregistrant la réponse brute renvoyée par Mindee. Cette réponse est automatiquement stockée dans le modèle, ce qui offre une transparence totale sur les données capturées. Cette fonctionnalité facilite ainsi :

  • l’analyse des données extraites ;

  • la détection d’éventuelles anomalies ou imprécisions ;

  • la validation des informations avant leur exploitation ou transformation par la suite dans les processus métier.

1.1. Sur l'image : Anomalie OCR Response.
1.1. Sur l'image : Anomalie OCR Response.