Saltar al contenido

¿Qué caracteres Unicode admite pdfLaTeX con un preámbulo mínimo?

Luis, miembro de este gran staff, nos ha hecho el favor de crear este tutorial porque domina a la perfección dicho tema.

Solución:

Un formato LaTeX actual ingresará omsenc.dfu, ot1enc.dfu, t1enc.dfu y ts1enc.dfu (esto es nuevo en un látex actual en comparación con la respuesta que vinculó también).

Puede encontrar los cuatro archivos en tex/latex/base y verifique qué entrada Unicode admiten. Como los nombres implican, su rango de soporte está relacionado con las codificaciones de salida, pero no existe una relación estricta de 1-1. t1enc.def por ejemplo contiene también DeclareUnicodeCharacter00A0nobreakspace.

No es necesario con un latex actual para cargar inputenc. utf8 es el predeterminado de todos modos. Entonces obtienes este apoyo también con este documento:

documentclassarticle
usepackage[T1]fontenc

begindocument
Text goes here.
enddocument

Su pregunta es bastante indefinida, ya que “preámbulo mínimo” puede interpretarse como “el mínimo requerido para admitir los caracteres Unicode necesarios”, que es algo circular.

El preámbulo de ejemplo publicado produce lo siguiente si agrego texto cirílico

! Package inputenc Error: Unicode character П (U+041F)
(inputenc)                not set up for use with LaTeX.

Como los puntos de código cirílicos no están configurados de forma predeterminada, pero independientemente de la codificación de entrada, no se escribirán de todos modos, ya que se especifica la codificación de fuente T1, que solo cubre el alfabeto latino.

Usted no necesita inputenc en látex actual, ya que UTF-8 es el valor predeterminado, y si especifica una codificación de fuente como X2 que incluye cirílico, se cargarán las asignaciones Unicode adecuadas
x2enc.dfu que está en la distribución del látex base.

Así que esto se ejecuta sin error:

documentclassarticle
usepackage[T1,X2]fontenc
begindocument
fontencodingT1selectfont Text goes here. Привет
enddocument

El archivo /usr/local/texlive/2020/texmf-dist/tex/latex/base/utf8enc.dfu (usar kpsewhich utf8enc.dfu para encontrar el archivo en su sistema local) enumera todos los caracteres declarados en la codificación dfu archivos en la distribución base, pero los paquetes contribuidos pueden agregar más.

grep '[.]dfu' `kpsewhich --all ls-R`

enumerará todos los disponibles, así como las codificaciones principales en griego latino y cirílico que veo armglyphs.dfupmboxdrawenc.dfuotf-hangul.dfupor ejemplo.

Básicamente, la restricción no está en la interpretación de UTF-8. El código inputenc de Pdflatex comprende la codificación UTF-8 completa y, por lo tanto, puede especificar cualquier número Unicode. Pero una fuente en pdflatex solo puede tener 256 caracteres, por lo que la mayoría de los caracteres Unicode no se pueden definir hasta que especifique una fuente para cubrir el conjunto de caracteres requerido.

Si tiene una fuente que cubre un rango Unicode; el mapeo inputenc correspondiente probablemente ya existe (y se ingresará automáticamente para cualquier codificación de fuente declarada en el preámbulo) o se puede agregar fácilmente.

Nos puedes patrocinar nuestro estudio fijando un comentario o valorándolo te estamos eternamente agradecidos.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)


Tags : /

Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *