Avatar billede Chickencry Novice
24. november 2015 - 10:30 Der er 7 kommentarer

OCR scanning PDF til RTF filer

Hej jeg scanner tonsvis af dokumenter hver dag til PDF og jeg leder derfor efter et software der kan OCR behandle mange filer på en gang og så er det vigtigt at jeg også kan konvertere mange PDF filer på en gang til RTF så de er søgbare i windows systemet, altså sådan at man kan søge på fx. "Don Juan" og så kommer alle dokumenter frem med "Don Juan" i teksten, således at man ikke behøver at bruge Adobe Reader til at lave en advanced search. Håber det er til at forstå.
Adobe Acrobat Extended er desværre udelukket pga. prisen.

Jeg håber virkelig i har nogle gode løsninger er ved at være godt træt af at sidde og gøre det manuelt for hver enkelt fil!

Mange tak på forhånd, hilsen Luca.
Avatar billede acore Ekspert
24. november 2015 - 12:58 #1
Avatar billede Chickencry Novice
24. november 2015 - 14:45 #2
Hmm har prøvet at lave noget research på programmet men er ikke i stand til at finde ud af om det kan det jeg skal bruge det til. :(
Kan ikke installere det på min computer pga. det er en arbejdscomputer, så jeg skal være sikker på det kan det jeg skal bruge det til før jeg går videre med det til it-mand som så skal ligge det over på min computer.

Det er derfor lige lidt besværligt men giver gerne så mange point jeg kan for at få det løst. :)
Avatar billede acore Ekspert
24. november 2015 - 16:51 #3
Hvad skal det kunne? Uden svar på det er det svært at hjælpe mere.

Men du kan teste det på https://www.newocr.com/
Avatar billede Chickencry Novice
25. november 2015 - 09:51 #4
Jeg synes jeg rimelig godt har forklaret hvad det skal kunne aller øverst fordi jeg nemlig vil gøre det så nemt og lige til som muligt. Jeg ved ikke hvordan jeg skal uddybe det bedre end jeg har gjort i toppen af tråden. Jeg prøver lige at komme med en anden for for eksempel her. Mange tak for hjælpen :)

Eks.
(10 PDF filer)----OCRscan+konvertering til RTF filer--> = 10 windows-søgbare RTF filer.

Behøver dermed ikke at gå ind i hver eneste PDF og søge manuelt eller bruge Adobe Readers "advanced search" til at finde søgeord i dokumenter, men så man kan søge i en mappe hvor alle filerne ligger på en gang.
Jeg har mapper med tusind dokumenter, og vil gerne gøre det så nemt og hurtigst muligt at finde de ting jeg skal bruge frem.
Avatar billede acore Ekspert
25. november 2015 - 11:38 #5
Det, som du beder om, kan Tesseract uden problemer levere på Linux. Om det også kan på Windows ved jeg ikke.
Avatar billede Chickencry Novice
27. november 2015 - 10:56 #6
Har undersøgt det og det ser ud til at være et meget avanceret program, hvor man skal skrive diverse commands og lignende for at få det til at fungere.
Jeg har søgt på Google og Youtube omkring det den skulle kunne men kan ikke finde nogle resultater.

Jeg vil gerne installere det på computeren og prøve det af, men det er en længere process at få det hentet og installeret på computeren efter som det er en arbejdscomputer.
Avatar billede acore Ekspert
27. november 2015 - 11:53 #7
Du behøver ikke bruge det som command-line. På https://github.com/tesseract-ocr/tesseract/wiki/3rdParty#gui er der 7 windows gui frontends til systemet. Så det er bare at vælge.

Nu ved jeg af gode grunde ikke, hvad du ikke kan finde info om i dine egne søgninger - jeg har bare svaret på dine spørgsmål her.
Avatar billede Ny bruger Nybegynder

Din løsning...

Tilladte BB-code-tags: [b]fed[/b] [i]kursiv[/i] [u]understreget[/u] Web- og emailadresser omdannes automatisk til links. Der sættes "nofollow" på alle links.

Loading billede Opret Preview

Log ind eller opret profil

Hov!

For at kunne deltage på Computerworld Eksperten skal du være logget ind.

Det er heldigvis nemt at oprette en bruger: Det tager to minutter og du kan vælge at bruge enten e-mail, Facebook eller Google som login.

Du kan også logge ind via nedenstående tjenester