La logique derrière la reconnaissance de factures à l’aide d’un logiciel OCR

En tant que fournisseurs d’une solution de reconnaissance de factures, nous nous faisons un plaisir d’aider nos clients à comprendre quelle est la logique derrière la reconnaissance. En effet, c’est une question qu’ils nous posent souvent. Critères pour qu’une facture soit bien reconnue ? Dans une situation idéale, la plupart des fournisseurs livrent, outre la facture PDF, un UBL depuis leur programme de facturation. Ainsi, cette facture peut être traitée directement de manière numérique et aucune opération supplémentaire n’est nécessaire. Vu que ce n’est pas encore une réalité, une bonne reconnaissance de factures est d’une importance capitale.

Qu’est-ce que la reconnaissance de factures à l’aide d’un logiciel OCR précisément et quelle en est la logique ?

Qu’est-ce que la reconnaissance de factures à l’aide d’un logiciel OCR?

Pour convertir une facture PDF en UBL, on utilise un logiciel OCR. L’OCR, pour « Optical Character Recognition » ou reconnaissance optique de caractères en français, est une technique dans le cadre de laquelle on extrait tous les caractères d’une image ou d’un PDF à l’aide de la reconnaissance de modèles.

Pour la reconnaissance de factures, c’est donc la mise en page de la facture PDF qui est lue. Les données de celle-ci sont ainsi converties en texte pour une conversion ultérieure en un UBL. Il est évident que, plus la structure de la mise en page de cette facture est logique, plus la qualité de la reconnaissance sera élevée. Et c’est là que le bât blesse justement. La structure d’une facture n’est pas linéaire.

Vous êtes vous-même responsable de la mise en page de la facture

Voici déjà la première logique : plus la qualité de la structure et des données de la facture PDF est élevée, plus la qualité de la reconnaissance de la facture le sera. Vous pouvez assurer une meilleure reconnaissance en introduisant de petites modifications à la mise en page de la facture. La conversion automatique en UBL se déroule alors de manière plus fluide et les opérations manuelles nécessaires au traitement ultérieur diminuent.

En bref, résolvez les problèmes au début de la chaîne. Vous rencontrerez moins de problèmes et vous aurez moins de travail à la fin de la chaîne.

La logique derrière la reconnaissance de factures

Nous vous donnons ici quelques faits sur lesquels se base la reconnaissance de factures. Ainsi, quelques petites modifications à la mise en page de vos factures peuvent faire une grande différence.

Qu’est-ce qui est généralement entièrement reconnu?

Les numéros d’entreprise des clients et fournisseurs et également les numéros VCS sont généralement entièrement reconnus par le logiciel OCR. La raison en est que ce sont des données clairement vérifiables à l’aide d’une somme de contrôle.

Logique de colonne et de ligne

Les données sont associées entre elles dans des colonnes ou des lignes. Si, par exemple, le numéro de la facture ne figure pas derrière ou en dessous de la référence « numéro de facture/numéro de document », il est plus difficile, voire impossible à reconnaître.

La délimitation effective des données de ligne et de colonne à l’aide de lignes améliore en outre la reconnaissance.

Pourcentage TVA

Pour le taux de TVA, la reconnaissance de factures recherche un montant suivi par le signe de pourcentage. Si le signe de pourcentage n’est pas indiqué ou est placé devant le montant, la reconnaissance est compliquée.

Si aucun signe de pourcentage n’est indiqué, le logiciel propose 21 % par défaut, car c’est le taux de TVA qui est le plus fréquent.

Exemple facture 1

Il est également d’une importance cruciale d’uniquement indiquer le pourcentage TVA qui est effectivement d’application. Nous voyons très souvent que d’autres pourcentages TVA sont également indiqués, même s’ils ne s’appliquent pas. N’indiquez que le pourcentage TVA qui est effectivement calculé. Il vaut mieux omettre les autres. Ainsi, le logiciel OCR peut reconnaître le pourcentage TVA correct avec plus de sûreté.

Exemple facture 2

Champs d’en-tête

Placez le champ d’en-tête toujours au-dessus de la donnée. Si celui-ci est placé en dessous, il est plus difficile ou impossible à lire. Dans l’exemple ci-dessous, cette règle s’applique au champ « À payer ». Celui-ci est placé en dessous du champ de donnée et ne sera donc pas ou difficilement lu.

Exemple facture 3

Numéro d’entreprise

Bien que nous ayons déjà mentionné ci-dessus qu’un numéro d’entreprise peut toujours être reconnu, il est toutefois important de l’indiquer clairement sur la facture. Souvent, ce numéro est placé quelque part en bas, dans une note de bas de page, ou en petites lettres, de sorte qu’il ne peut pas être reconnu. Indiquez toujours clairement et de manière lisible votre numéro d’entreprise et celui de votre client sur la facture. Appliquez une taille de police normale et utilisez un endroit clair. Ce numéro peut éventuellement est repris en haut, près du logo ou des données de la facture.

Généralités

Voici aussi quelques éléments intéressants concernant la mise en page de la facture PDF dont vous pouvez facilement tenir compte.

En attendant la situation idéale, dans laquelle toute facture PDF est associée à une facture UBL, le logiciel de reconnaissance est une bonne alternative temporaire pour gagner du temps.

Mais facilitez-vous la vie. Augmentez le pourcentage de reconnaissance de factures en introduisant ces simples petites modifications à la mise en page de vos propres factures ou en donnant ces conseils à vos clients et fournisseurs. C’est un petit effort qui augmente immédiatement la qualité de la reconnaissance automatique de factures. Ainsi, vos opérations manuelles diminuent considérablement et, par conséquent, votre productivité augmente.

Pour le reste, vous pouvez compter sur Comax. Nous veillons à ce qu’un fichier UBL soit automatiquement créé de toute facture et que celui-ci puisse être lu dans chaque progiciel de comptabilité. Saviez-vous d’ailleurs que notre module Comax ocr & search assure une reconnaissance complète des textes de toutes vos archives numériques ? Il est combiné à un moteur de recherche compréhensif pour que vous ne perdiez plus jamais d’informations cruciales. Vous trouverez plus d’informations ici.

N’hésitez pas à nous contacter si vous avez d’autres questions ou si vous voulez obtenir des conseils.

23 juillet 2021