De logica achter factuurherkenning met OCR software
Als leverancier van een factuurherkenningsoplossing krijgen wij dikwijls de vraag van onze klanten wat de logica achter de herkenning is. Wat maakt dat een factuur goed herkend kan worden? In een ideale situatie leveren de meeste leveranciers meteen vanuit hun facturatieprogramma een UBL aan naast de PDF factuur. Zo kan deze meteen digitaal verwerkt worden en zijn er geen extra handelingen meer nodig. Aangezien we nog niet zo ver zijn, is een goede factuurherkenning van groot belang.
Wat is nu juist factuurherkenning met OCR software en hoe zit deze logica in elkaar?
Wat is factuurherkenning met OCR software
Om een PDF factuur om te zetten naar UBL, wordt er gebruikt gemaakt van OCR software. OCR, Optical Character Recognition of in het Nederlands optische tekenherkenning, staat voor een techniek waarbij uit een afbeelding of PDF, door middel van patroonherkenning, alle tekens worden uitgehaald.
Voor factuurherkenning wordt dus de lay-out van de PDF factuur gelezen en worden zo de gegevens daaruit omgezet naar tekst voor verdere verwerking naar een UBL. Het spreekt voor zich: hoe logischer de opbouw van de lay-out van deze factuur, hoe waardevoller de herkenning. En daar wringt nu net het schoentje. Er is geen rechtlijnigheid in hoe een factuur opgebouwd is.
De lay-out van de factuur heeft u zelf in de hand
Hier meteen de eerste logica: hoe kwalitatiever de opbouw en gegevens van de PDF factuur, hoe waardevoller de factuurherkenning. Mits kleine aanpassingen aan de lay-out van de factuur, kan u er zelf voor zorgen dat er een hogere herkenning mogelijk is. Zo verloopt de automatische omzetting naar UBL vlotter en verminderen de manuele handelingen die nodig zijn voor verdere verwerking.
Kort gezegd, los de problemen op aan het begin van de ketting. Dit zorgt voor minder problemen en minder werk op het einde van de ketting.
De logica achter factuurherkenning
We geven graag enkele feiten mee waarop factuurherkenning zich baseert. Zo kunnen kleine aanpassingen aan de lay-out van uw facturen een groot verschil maken.
Wat wordt er meestal 100% herkend
Ondernemingsnummers van klanten en leveranciers en ook OGM nummers worden meestal 100% herkend door de OCR software. Dit omdat deze duidelijk controleerbare gegevens zijn met een checksum.
Kolom en rij – logica
Gegevens worden aan elkaar gerelateerd in kolommen of rijen. Staat bijvoorbeeld het factuurnummer dus niet achter of onder de verwijzing “factuurnummer / documentnummer” dan is dit moeilijker of niet herkenbaar.
De effectieve afbakening van rij- en kolomgegevens met lijnen verbetert bovendien de herkenning ook nog.
BTW percentage
Voor de BTW voet gaat de factuurherkenning op zoek naar een bedrag waar een percentage-teken achter staat. Het percentage-teken er niet bij vermelden of voor het bedrag plaatsen, geeft een moeilijkere herkenning.
Indien er geen percentage-tekens vermeld staan, stelt de software als standaard 21% voor omdat deze BTW voet het meeste voorkomt.
Ook is het van groot belang dat enkel het BTW percentage vermeld staat dat effectief van toepassing is. We zien heel vaak dat de andere BTW percentages eveneens vermeld staan, ook al zijn ze niet van toepassing. Vermeld enkel het BTW percentage dat effectief berekend wordt. De andere laat u best achterwege. Zo kan de OCR software er met meer zekerheid het juiste BTW percentage uit herkennen.
Header velden
Zet het header veld steeds boven het gegeven. Staat deze eronder dan kan dit niet of moeilijker uitgelezen worden. In het voorbeeld hieronder is dit van toepassing op het ‘Te betalen’ veld. Deze staat onder het dataveld en wordt dus niet of moeilijk uitgelezen.
Ondernemingsnummer
Hoewel we hierboven reeds vermeld hebben dat een ondernemingsnummer steeds herkend kan worden, is het toch belangrijk dat deze heel duidelijk vermeld wordt op de factuur. Dikwijls staat deze ergens onderaan in de voetnoot of heel klein vermeld waardoor deze toch niet herkend kan worden. Vermeld steeds duidelijk en leesbaar uw ondernemingsnummer en dat van uw klant op de factuur. Doe dit op een normale tekstgrootte en op een duidelijke plaats. Eventueel kan deze mee opgenomen worden bovenaan bij het logo of de factuurgegevens.
Algemeen
We geven graag nog een paar kleine weetjes mee waar ook gemakkelijk rekening mee gehouden kan worden in de lay-out van de PDF factuur.
- Beperk het gebruik van kleuren. Deze vormen mogelijks problemen voor een goede herkenning. Gebruikt u toch kleur, hou dan zeker rekening met de contrasten. Indien er tussen de kleuren, zelfs bij grijstinten, onvoldoende contrasten zijn, bemoeilijkt dit het uitlezen. De kleurencombinatie zwart-wit blijft de beste optie voor factuurherkenning.
- Werk met de klassieke lettertypes of de ‘sans-serif’ lettertypes (schreefloos). Zonder te veel krullen of streepjes aan de letter heeft het letterbeeld een grotere variatievorm. Hierdoor zijn de letters makkelijker te onderscheiden en dus herkenbaarder.
- Hou uw lay-out best simpel. Als uw geleverd product of dienst in orde was, zal de betaling van de factuur wel volgen. Een digitaal goed herkende factuur zorgt namelijk ook voor een snellere betaling.
- Zet alle headergegevens duidelijk op de factuur met de juiste benaming in de buurt: Factuurdatum: 17/6/19 Factuurnummer: 2019095 . Vermijd eveneens spaties in factuurnummers. Schrijf niet: 2019 / 095 maar wel: 2019/095. En baken ook OGM nummers correct af. Dit betekent : +++123/1234/12345+++ of ***123/1234/12345*** Anders worden ze moeilijker of niet herkend.
- Laat de tekst niet door kolomlijnen lopen of zet ze niet te dicht tegen een kaderlijn. Dit bemoeilijkt de leesbaarheid en dus ook de factuurherkenning.
- En last but not least: laat uw klant een digitaal ontvangen factuur digitaal doorsturen. Zo heeft u geen kwaliteitsverlies door printen en opnieuw scannen. Slechte scans zijn namelijk heel dikwijls de oorzaak van een slechte herkenning.
In afwachting van de ideale situatie waarbij elke PDF factuur gekoppeld is aan een UBL factuur, is herkenningssoftware een goed, tijdelijk alternatief om tijd te doen besparen.
Maar maak het uzelf hierin gemakkelijk. Verhoog het percentage van factuurherkenning door deze kleine en eenvoudige aanpassingen door te voeren in de lay-out van uw eigen facturen of door deze tips mee te geven aan uw klanten en leveranciers. Dit is een kleine moeite die de kwaliteit van de automatische factuurherkenning onmiddellijk verhoogt. Hierdoor verminderen uw manuele handelingen aanzienlijk en bijgevolg verhoogt uw productiviteit.
Voor de rest laat u het maar aan COMAX over. Wij zorgen ervoor dat er van elke factuur automatisch een UBL bestand gecreëerd wordt dat in elk boekhoudpakket ingelezen kan worden. Wist u trouwens dat onze module COMAX ocr & search zorgt voor een volledige tekstherkenning op heel uw digitaal archief? Dit samen met een uitgebreide zoekmotor verliest u nooit meer cruciale informatie. Meer informatie hierover vindt u hier.