Stel een vraag

Data-Entry

multiscan data entry

 

Data-entry verdelen we in een aantal verschillende aktiviteiten:

Koppelen

Het maken van digitale "koppelingen" tussen het digitale document en de meta-data in de database.

Metadata verrijking

Metadata zijn gegevens die de karakteristieken van bepaalde gegevens\documenten beschrijven. Door het overnemen van deze karakteristieken wordt de gekoppelde data verrijkt met extra informatie. U moet denken aan het overtypen van teksten, datums e.d. Ook kan er worden gerubriceerd waarbij digitale documenten in bepaalde rubrieken worden ingedeeld. Door toepassing van OCR technieken kan veel metadata op autmatische wijze worden verkregen, overgenomen en gecategoriseerd. Kan er geen gebruik gemaakt worden van geautomatiseerde technieken dan worden onze data-operators ingezet voor een visuele afhandeling.

Metadata controle

Veel databases zijn vaak door allerlei oorzaken, denk aan fusies, verkeerde invoer maar ook door wisselende werkwijze's, vervuild geraakt met onjuiste, dubbele of fout geschreven meta-data. Door op efficiente wijze uw database(s) te controleren en onjuistheden te corrigeren zorgt Multiscan ervoor dat er meer efficiëncy en rendement uit uw data kan worden gehaald.

OCR, ICR en OMR

Met OCR (Optical Character Recognition) wordt het herkennen van gedrukte tekst bedoeld. De herkenningsgraad is sterk afhankelijk van de kwaliteit (leesbaarheid) van het digitale document. Doorgaans worden documenten bedoeld voor OCR herkenning op 300 dpi gescand.

Met ICR ((Intelligent Character Recognition) wordt gebruikt voor het herkennen van handgeschreven teksten. Handschriftherkenning is vele malen ingewikkelder dan het herkennen van gedrukte tekst, vanwege de grote variatie in schrijfwijzen. Toch wordt deze techniek veel en succesvol ingezet voor het herkennen van handgeschreven teksten op met name formulieren. Doordat de tekst daar op vaste plaatsen staat en ook vaak een specifieke betekenis heeft, bijvoorbeeld postcode, registratienummer, adres, getal, is er door de softwaresystemen toch een goede herkenbaarheid.

Naast OCR en ICR bestaat er ook nog OMR (Optical Mark Recognition), dit is een vergelijkbare technologie die echter gespecialiseerd is in de herkenning van aangevinkte vakjes en zwart gemaakte rondjes (voor toepassingen zoals de Citotoets). Kenmerkend voor deze techniek is over het algemeen het gebruik van formulieren die gedrukt zijn in een bepaalde kleur die bij het scannen wegvalt. Alleen de markeringen blijven dan over waardoor ze nog gemakkelijker door de software herkend kunnen worden.

 

(bron: www.wikipedia.org)