[Linux-bruxelles] souci de layout avec un manuel en PDF

Aldo info at brlspeak.net
Mer 2 Fév 13:05:08 CET 2022


Hello. 

j'essaye de convertir en txt le pdf d'un manuel d'utilisation d'une table de
mixage (TASCAM Model 12):
pdftotext ou pdftohtml font ça +/- bien, 
sauf que le manuel est en colonnes et que parfois des bouts de phrase de la
colonne de droite s'intercallent dans la suite "logique" du texte, me
faisant perdre le fil: 
peut-on "défaire" cette structure et obtenir par une commande donnée que le
texte suive son cours sans layout particulier, je pensais à l'option -raw de
pdftotext, mais p-e que je me tompes ?

Merci pour vos bons conseils!

@+
Aldo.



Plus d'informations sur la liste de diffusion Linux-bruxelles