Tilfeldig Mandag: Moro med batch-filer - Konvertering av PDF-filer til TXTs
Jeg var å tukle med Kryloff Technologies er gettext forrige uke å eksportere den første 100 utgaver av Computer Gaming World til TXT-format for å lese på min mobiltelefon ved hjelp TequilaCat Book Reader, da jeg skjønte at gjentatte ganger å skrive, og deretter klippe og lime kommandoer ved ledeteksten 100 ganger ikke en god idé å tilbringe en kostbar helg. Riktignok er det vanlig TXT-format ikke den beste måten å nyte disse skattene men jeg har liten tid til å lese unntatt på vei til jobb ![]()
Nå skrive et program for å gjøre dette i C #. NET der jeg skrive kode på jobben ville bli en triviell oppgave, men det virker som overkill for en slik enkel oppgave, så jeg bestemte meg for å friske opp min rustne kunnskap om DOS-kommandoer for å automatisere eller minst semi-automatisere denne prosessen.
Må lese på hvis du er interessert i å forstå hvordan bunkefiler arbeidet, ellers bare blar til bunnen av dette innlegget for å laste ned forhåndslagde bunkefiler å konvertere enten en enkelt fil eller en mappe med PDF-filer til tekst.
Nå lage en batch-fil (en TXT-fil med en utvidelse BAT) med følgende kommando:
% ~ dp0gettext.exe% 1% 1.txt
og slippe den inn i gettext mappen raskt tillater meg å dra og slippe alle PDF (eller faktisk hvilken som helst fil konvertible av gettext) på den satsvise filen og umiddelbart konvertere den til en. TXT-fil i samme katalog som filen til å konvertere.
% ~ dp0 er erstattet med den fullstendige banen til batch-filen uten filnavnet til den satsvise filen, som i hovedsak peker til den fullstendige banen til gettext programmet.
% 1 refererer til filen blir sluppet inn i batch filen. For noen systemer, fant jeg ut at jeg trengte å vedlegge% 1 med doble anførselstegn for å tilfredsstille stier med mellomrom i dem, mens andre systemer håndtere lange filnavn uten å måtte doble anførselstegn.
Nå automatisk konvertering av en enkelt fil ikke er altfor shabby men det er fortsatt ikke bra nok. Dra og slippe 10 filer er OK, men ikke 100
Så jeg Googled for noen ressurser og fant Rick Lively's Command Reference, en praktisk guide for alle DOS / Ledetekst kommandoer sammen med noter og eksempler.
Nå bevæpnet med en FOR løkke fra denne referansen, opprettet jeg en batch fil til å behandle alle filene i en mappe.
for%% f in (% 1 \ *. pdf) gjør% ~ dp0gettext.exe%% f%% f.txt
En kort forklaring på hva som skjer her.
% 1 er mappen der du slapp inn i batch filen.
For-erklæringen tar da alle filene i denne mappen med en PDF-forlengelse og passerer hvert gjeldende filen til gettext som variabelen%% f sekvensielt.
Ikke dårlig for en enkelt tekstlinje. Noen ganger kan en kjennskap til noen vanlige DOS-kommandoer håndtere visse oppgaver raskere enn å skrive kode ![]()
Sjekk ut Kryloff Technologies 'gettext nytte, Rick's Lively nedlastbare Command Reference eller mine forhåndslagde batch-filer. Opprette snarveier til disse to batch-filer, og du kan bruke dem i de fleste situasjoner å konvertere dine tekstfiler ved å dra og slippe filer eller mapper over bunkefiler hhv.
Mer @ THE LAST NED MUNKEY:
Les bøker på mobiltelefonen med TequilaCat BookReader
Tekst Mining Tools - Utdrager tekst fra CHMs
Wikipedia, WikiType & PDF Wikier









































