Wie durchsuche ich am besten viele große PDF Dateien?

Gibt es da ein gutes Tool für Debian?

@frommMoritz @clerie Dazu legst du dir am besten einen alias in der bashrc an, sodass es schneller geht, wenn du die selbe Datei mehrmals durchsuchst: "alias pdfgrep="pdfgrep --cache"
"

@frommMoritz @clerie Mein Standardaufruf ist pdfgrep -inr "Keyword". Damit werden alle Dateien im aktuellen Directory durchsucht

@frainz @frommMoritz Sehr gut. Cache ist nicht ganz so wichtig. Alle Skripte dieses Semsters drchsuchen dauert bei mir weniger als 5 sec 😉

Follow

@clerie @frainz Und jetzt überlege dir mal, wie viel schneller das mit Cache ginge 😂

@frommMoritz @frainz Nicht schneller, weil die Ausgabe auf der Konsole zu langsam ist 😉

@clerie @frommMoritz Ich hab das mal mit den Folien von Telematik 1 getestet:

time pdfgrep -inr "tcp"
real 0m0.089s
user 0m0.068s
sys 0m0.021s

time command pdfgrep -inr "tcp"
real 0m12.535s
user 0m12.326s
sys 0m0.209s

command bewirkt, dass aliase ignoriert werden.

Sign in to participate in the conversation
chaos.social

The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!