Du bist nicht angemeldet (anmelden)
Seite 1
Scan-PDF auf eingebetteten Text reduzieren
Ich habe mehrere PDFs, die aus Scans verschiedener Zeitungsseiten oder Büchern bestehen. In diesen PDFs ist (in ziemlich schlechter Qualität und dank vieler unsinniger Farben oder schwarzem Rand für Druck recht ungeeignet) das Originaldokument zu sehen, aber der tatsächliche Text ist auch markier- und kopierbar vorhanden (wurde wohl irgendwie OCR-mäßig erkannt).
Wie bekome ich nun in Acrobat diese ganzen Bilder raus und nur den Text ausgegeben? Wenn ich alles rauskopiere, verliere ich ja die Formatierung.
Danke für jede Hilfe.
Wie bekome ich nun in Acrobat diese ganzen Bilder raus und nur den Text ausgegeben? Wenn ich alles rauskopiere, verliere ich ja die Formatierung.
Danke für jede Hilfe.
wo willst du den text denn reinhaben?
eine möglichkeit wäre evtl. das pdf per acrobat als .doc abzuspeichern und daraus dann den text zu entnehmen.
eine möglichkeit wäre evtl. das pdf per acrobat als .doc abzuspeichern und daraus dann den text zu entnehmen.
Moin fabian,
ich hab 3 Vorschläge, die vielleicht etwas bringen könnten:
1. Ist der Text noch da, wenn Du mit dem Touch-Up-Objektwerkzeug die Bilder löschst? (Ich vermute, dass dies nicht der Fall ist, da Acrobat die Bilder nur als durchsuchbare Bilder behandelt...)
2. versuche mal, über »speichern unter« dasPDF in einem anderen Format abzuspeichern (z.B. Word), vielleicht bringt dies schon den gewünschten Effekt, das der Text maschinenlesbar erscheint (kann mir aber auch gut vorstellen, dass der Export dann auch nur die Bilder im Word-Dokument einbaut)
3. was mir der beste Weg scheint: die PDF-Dateien als Bild speichern , mit z.B. Grafikprogramm bearbeiten und anschliessend noch einmal ein OCR (lieber nicht das von Acrobat, das scheint mir nicht so gut zu sein...) drüber laufen lassen.
Gib mal Bescheid, ob's funzt
ich hab 3 Vorschläge, die vielleicht etwas bringen könnten:
1. Ist der Text noch da, wenn Du mit dem Touch-Up-Objektwerkzeug die Bilder löschst? (Ich vermute, dass dies nicht der Fall ist, da Acrobat die Bilder nur als durchsuchbare Bilder behandelt...)
2. versuche mal, über »speichern unter« dasPDF in einem anderen Format abzuspeichern (z.B. Word), vielleicht bringt dies schon den gewünschten Effekt, das der Text maschinenlesbar erscheint (kann mir aber auch gut vorstellen, dass der Export dann auch nur die Bilder im Word-Dokument einbaut)
3. was mir der beste Weg scheint: die PDF-Dateien als Bild speichern , mit z.B. Grafikprogramm bearbeiten und anschliessend noch einmal ein OCR (lieber nicht das von Acrobat, das scheint mir nicht so gut zu sein...) drüber laufen lassen.
Gib mal Bescheid, ob's funzt
