La logique derrière la reconnaissance de factures à l’aide d’un logiciel OCR
En tant que fournisseurs d’une solution de reconnaissance de factures, nous nous faisons un plaisir d’aider nos clients à comprendre quelle est la logique derrière la reconnaissance. En effet, c’est une question qu’ils nous posent souvent. Critères pour qu’une facture soit bien reconnue ? Dans une situation idéale, la plupart des fournisseurs livrent, outre la facture PDF, un UBL depuis leur programme de facturation. Ainsi, cette facture peut être traitée directement de manière numérique et aucune opération supplémentaire n’est nécessaire. Vu que ce n’est pas encore une réalité, une bonne reconnaissance de factures est d’une importance capitale.
Qu’est-ce que la reconnaissance de factures à l’aide d’un logiciel OCR précisément et quelle en est la logique ?
Qu’est-ce que la reconnaissance de factures à l’aide d’un logiciel OCR?
Pour convertir une facture PDF en UBL, on utilise un logiciel OCR. L’OCR, pour « Optical Character Recognition » ou reconnaissance optique de caractères en français, est une technique dans le cadre de laquelle on extrait tous les caractères d’une image ou d’un PDF à l’aide de la reconnaissance de modèles.
Pour la reconnaissance de factures, c’est donc la mise en page de la facture PDF qui est lue. Les données de celle-ci sont ainsi converties en texte pour une conversion ultérieure en un UBL. Il est évident que, plus la structure de la mise en page de cette facture est logique, plus la qualité de la reconnaissance sera élevée. Et c’est là que le bât blesse justement. La structure d’une facture n’est pas linéaire.
Vous êtes vous-même responsable de la mise en page de la facture
Voici déjà la première logique : plus la qualité de la structure et des données de la facture PDF est élevée, plus la qualité de la reconnaissance de la facture le sera. Vous pouvez assurer une meilleure reconnaissance en introduisant de petites modifications à la mise en page de la facture. La conversion automatique en UBL se déroule alors de manière plus fluide et les opérations manuelles nécessaires au traitement ultérieur diminuent.
En bref, résolvez les problèmes au début de la chaîne. Vous rencontrerez moins de problèmes et vous aurez moins de travail à la fin de la chaîne.
La logique derrière la reconnaissance de factures
Nous vous donnons ici quelques faits sur lesquels se base la reconnaissance de factures. Ainsi, quelques petites modifications à la mise en page de vos factures peuvent faire une grande différence.
Qu’est-ce qui est généralement entièrement reconnu?
Les numéros d’entreprise des clients et fournisseurs et également les numéros VCS sont généralement entièrement reconnus par le logiciel OCR. La raison en est que ce sont des données clairement vérifiables à l’aide d’une somme de contrôle.
Logique de colonne et de ligne
Les données sont associées entre elles dans des colonnes ou des lignes. Si, par exemple, le numéro de la facture ne figure pas derrière ou en dessous de la référence « numéro de facture/numéro de document », il est plus difficile, voire impossible à reconnaître.
La délimitation effective des données de ligne et de colonne à l’aide de lignes améliore en outre la reconnaissance.
Pourcentage TVA
Pour le taux de TVA, la reconnaissance de factures recherche un montant suivi par le signe de pourcentage. Si le signe de pourcentage n’est pas indiqué ou est placé devant le montant, la reconnaissance est compliquée.
Si aucun signe de pourcentage n’est indiqué, le logiciel propose 21 % par défaut, car c’est le taux de TVA qui est le plus fréquent.
Il est également d’une importance cruciale d’uniquement indiquer le pourcentage TVA qui est effectivement d’application. Nous voyons très souvent que d’autres pourcentages TVA sont également indiqués, même s’ils ne s’appliquent pas. N’indiquez que le pourcentage TVA qui est effectivement calculé. Il vaut mieux omettre les autres. Ainsi, le logiciel OCR peut reconnaître le pourcentage TVA correct avec plus de sûreté.
Champs d’en-tête
Placez le champ d’en-tête toujours au-dessus de la donnée. Si celui-ci est placé en dessous, il est plus difficile ou impossible à lire. Dans l’exemple ci-dessous, cette règle s’applique au champ « À payer ». Celui-ci est placé en dessous du champ de donnée et ne sera donc pas ou difficilement lu.
Numéro d’entreprise
Bien que nous ayons déjà mentionné ci-dessus qu’un numéro d’entreprise peut toujours être reconnu, il est toutefois important de l’indiquer clairement sur la facture. Souvent, ce numéro est placé quelque part en bas, dans une note de bas de page, ou en petites lettres, de sorte qu’il ne peut pas être reconnu. Indiquez toujours clairement et de manière lisible votre numéro d’entreprise et celui de votre client sur la facture. Appliquez une taille de police normale et utilisez un endroit clair. Ce numéro peut éventuellement est repris en haut, près du logo ou des données de la facture.
Généralités
Voici aussi quelques éléments intéressants concernant la mise en page de la facture PDF dont vous pouvez facilement tenir compte.
- Limitez l’utilisation de couleurs. Celles-ci peuvent engendrer des problèmes pour une bonne reconnaissance. Si vous utilisez quand même des couleurs, tenez alors surtout compte des contrastes. Si, entre les couleurs, même en cas de nuances de gris, les contrastes sont insuffisants, la lecture est compliquée. La combinaison de couleurs noir et blanc reste la meilleure option pour la reconnaissance de factures.
- Utilisez des polices classiques ou des polices « sans-serif » (sans empattement). L’image des lettres présente une forme de variation plus grande sans trop de boucles ou de lignes à la lettre. Ainsi, les lettres sont plus faciles à distinguer et donc plus faciles à reconnaître.
- Il vaut mieux garder votre mise en page simple. Si votre produit ou service livré était en ordre, le paiement de la facture suivra. Une facture bien reconnue de façon numérique engendre en effet également un paiement plus rapide.
- Indiquez clairement toutes les données d’en-tête sur la facture, accompagnées de la bonne dénomination : Date de facture : 17/06/19 Numéro de facture : 2019095. Évitez également les espaces dans les numéros de facture : N’écrivez pas : 2019 / 095 mais : 2019/095. Et délimitez aussi correctement les numéros VCS. Cela signifie : +++123/1234/12345+++ ou ***123/1234/12345*** Sinon, ils seront difficiles ou impossibles à reconnaître.
- Ne laissez pas le texte traverser les lignes de colonne ou ne le placez pas trop près d’une ligne de cadre. Cela complique la lisibilité et donc également la reconnaissance de factures.
- Et, dernier point mais non des moindres : demandez à votre client d’envoyer par voie numérique une facture reçue par voie numérique. Ainsi, vous ne perdez pas en qualité en imprimant et en scannant à nouveau. En effet, les mauvais scans sont très souvent à la base d’une mauvaise reconnaissance.
En attendant la situation idéale, dans laquelle toute facture PDF est associée à une facture UBL, le logiciel de reconnaissance est une bonne alternative temporaire pour gagner du temps.
Mais facilitez-vous la vie. Augmentez le pourcentage de reconnaissance de factures en introduisant ces simples petites modifications à la mise en page de vos propres factures ou en donnant ces conseils à vos clients et fournisseurs. C’est un petit effort qui augmente immédiatement la qualité de la reconnaissance automatique de factures. Ainsi, vos opérations manuelles diminuent considérablement et, par conséquent, votre productivité augmente.
Pour le reste, vous pouvez compter sur Comax. Nous veillons à ce qu’un fichier UBL soit automatiquement créé de toute facture et que celui-ci puisse être lu dans chaque progiciel de comptabilité. Saviez-vous d’ailleurs que notre module Comax ocr & search assure une reconnaissance complète des textes de toutes vos archives numériques ? Il est combiné à un moteur de recherche compréhensif pour que vous ne perdiez plus jamais d’informations cruciales. Vous trouverez plus d’informations ici.