Saltar al contenido

Conversión de MS Word .doc a LaTeX por línea de comando

Si te encuentras con algún detalle que no comprendes puedes comentarlo y trataremos de ayudarte rápidamente.

Solución:

Esta respuesta es específica para OS X…

Utilidad de línea de comandos textutil

Hay una buena utilidad de línea de comandos llamada textutil incluido en OS X que convertirá entre formatos de documentos comunes:

Word docx a txt

$ textutil -convert txt worddoc.docx

txt a Word docx

$ textutil -convert docx mytextdoc.txt

txt a Word, usando Times New Roman 12pt

$ textutil -convert docx -font "Times New Roman" -fontsize 12 blah.txt

También funciona con html, rtf, doc, odt y otros…

word2latex y latex2word usando textutil con Pandoc

Si usa Pandoc en combinación con textutil puede tener un viaje de ida y vuelta decente de Word a LaTeX y de LaTeX a Word. Para soporte docx necesita la última versión de Pandoc (1.9+).

word2latex

$ textutil -convert html worddoc.docx -stdout | pandoc -s -f html -t latex -o latexdoc.tex

latex2word

$ pandoc -t docx -f latex -o backtoword.docx latexdoc.tex

Antiword va a hacer un trabajo razonablemente bueno convirtiendo archivos .doc a .tex. Hace todo lo posible para preservar no solo el contenido sino también el formato. Es muy adecuado para el procesamiento por lotes que desea realizar.

Editar: Varias personas me preguntaron en privado sobre el cambio de LaTeX en Antiword y la última versión de Antiword. De hecho, la última versión es la 0.37. A partir de la salida de LaTeX, creo que mixed subir un poco las cosas. Usé Antiword para la salida ASCII formateada. Creo que es capaz de salida PostScript pero no de salida LaTeX. Como observó Jon, puede usar pandoc para convertir ASCII bien formateado en LaTeX. Sin embargo, wvWare (wv y wv2) son capaces de generar LaTeX. Un poco de advertencia. wvWare se deprecia a favor de AbiWord, pero se puede usar para el procesamiento por lotes (no tengo ni idea de si AbiWord se puede usar desde la línea de comandos). Todavía es un programa un poco más joven (inactivo desde 2006) que Antiword (inactivo desde 2004).

Finalmente, hay una herramienta llamada catdoc que es excelente para el procesamiento por lotes pero no conservará el formato (aunque es excelente para extraer contenido y es compatible con el formato MS Excel).

Mucho depende de cuán complicado sea el formato del documento de Word. He tenido mucho éxito con rtf2latex2e, que convierte texto con formato RTF a LaTeX. Tiene varios niveles de coincidencia con el formato RTF. Principalmente he usado su “modo de marcado mínimo de LaTeX”, que es ideal para un documento que se editará posteriormente a mano (que entiendo que no son las mismas condiciones que usted requiere).

Te mostramos las comentarios y valoraciones de los lectores

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)



Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *