Tilfeldig mandag: Moro med satsvise filer - Konvertering av PDF-filer til TXTs
Jeg var fiddling med Kryloff Technologies er gettext sist uke for å eksportere de første 100 utgaver av Computer Gaming World til TXT-format for å leses på mobiltelefonen min ved hjelp TequilaCat Book Reader, når jeg innså at gjentatte ganger å skrive og deretter klippe og lime inn kommandoer ved Spør 100 ganger ikke lurt å bruke en verdifull helg. Innrømmer det vanlig TXT-format er ikke den beste måten å nyte disse skattene, men jeg har liten tid til å lese bortsett fra på den måten å arbeide ![]()
Nå skrive et program for å gjøre dette i C #. NET der jeg skrive koden i arbeid ville være en triviell oppgave, men det virker som overkill for en slik enkel oppgave, så jeg bestemte meg for å børste opp på min rusten kjennskap til DOS-kommandoer for å automatisere eller minst halv-automatiserer denne prosessen.
Har lest på hvis du er interessert i å forstå hvordan den satsvise filer arbeid, ellers ganske enkelt bla til bunnen av dette innlegget å laste ned premade gruppe filer til å konvertere en enkelt fil eller en mappe i PDF-filer til tekst.
Nå oppretter en batch-fil (TXT-fil med en BAT-utvidelsen) med følgende kommando:
% ~ dp0gettext.exe% 1% 1.txt
og slippe den inn i gettext mappen raskt tillater meg å dra og slippe noen PDF (eller faktisk en hvilken som helst fil konvertible av gettext) på den satsvise filen og umiddelbart konvertere den til en. txt-filen i samme katalog som filen til å konvertere.
% ~ dp0 er erstattes med den fullstendige banen for satsvis fil uten filnavn for satsvis fil som i hovedsak peker til den fullstendige banen til gettext søknaden.
% 1 refererer til filen blir droppet på satsvis fil. For noen systemer, fant jeg ut at jeg trengte å vedlegge% 1 med doble anførselstegn for å ta baner med mellomrom på dem mens andre systemer håndterer lange filnavn uten behov doble anførselstegn.
Nå automatisk konvertere en enkelt fil er ikke for shabby men det er fortsatt ikke god nok. Dra og slippe 10-filer er OK, men ikke 100
Så jeg Googled for noen ressurser og funnet Rick Livlig's Command Reference, en praktisk guide for alle DOS / Ledetekst kommandoer sammen med notater og eksempler.
Nå væpnet med FOR løkke fra denne referansen, jeg opprettet en satsvis fil til å behandle alle filene i en mappe.
for%% f in (% 1 \ *. pdf) gjøre% ~ dp0gettext.exe%% f%% f.txt
En kort forklaring av hva som skjer her.
1% er mappen der du falt inn i batch-fil.
For uttalelse deretter tar alle filer i denne mappen med en PDF-utvidelsen og passerer hver gjeldende filen til gettext som variabelen%% f sekvensielt.
Ikke verst for en enkelt linje med tekst. Noen ganger, en kunnskap om noen vanlige DOS-kommandoer kan håndtere visse oppgaver raskere enn å skrive kode ![]()
Check out Kryloff Technologies' gettext verktøyet, Rick Livlig's nedlastbare Command Reference eller min premade batch-filer. Lag snarveier til disse to batch-filer, og du kan bruke dem i de fleste situasjoner til å konvertere tekstfiler ved å dra og slippe filer eller mapper over den satsvise filer.
Mer @ Last ned MUNKEY:
Les bøker på mobiltelefonen med TequilaCat BookReader
Text Mining Verktøy - Extracting tekst fra CHMs
Wikibooks, WikiType & PDF Wikis























