Parsear un Font

Parsear Archivos de Fuente TrueType (TTF) — Referencia

Una guía práctica e independiente de implementación para leer el formato binario TTF. Está organizada alrededor del acto de parsear: la columna vertebral del documento es 5. Cómo parsear, que recorre el archivo en orden y enlaza cada paso con el diseño de bytes de esa tabla en 6. Referencia de tablas. Lee el flujo de parseo de arriba a abajo; accede al diseño de una tabla solo cuando necesites los campos exactos.

Tipo	Bytes	Significado
`uint8`	1	byte sin signo
`int8`	1	byte con signo
`uint16`	2	short sin signo
`int16`	2	short con signo
`uint24`	3	entero de 24 bits sin signo
`uint32`	4	long sin signo
`int32`	4	long con signo
`Fixed`	4	punto fijo con signo 16.16
`FWORD`	2	`int16` en unidades de diseño del font
`UFWORD`	2	`uint16` en unidades de diseño del font
`F2Dot14`	2	punto fijo con signo 2.14 (escalas/variaciones)
`LONGDATETIME`	8	`int64` con signo, segundos desde 1904-01-01 00:00 UTC
`Tag`	4	cuatro caracteres ASCII `uint8`, p.ej. `glyf`
`Offset16`	2	offset `uint16`
`Offset32`	4	offset `uint32`
`Version16Dot16`	4	versión mayor/menor empaquetada

Tipo	Nombre	Notas
`uint32`	sfntVersion	`0x00010000` = contornos TrueType; `0x4F54544F` (`OTTO`) = CFF/PostScript; `0x74727565` (`true`) en Apple. Tu verificación de “¿es un TTF?”.
`uint16`	numTables	número de registros de tabla que siguen
`uint16`	searchRange	`(mayor potencia de 2 ≤ numTables) × 16`
`uint16`	entrySelector	`log2(mayor potencia de 2 ≤ numTables)`
`uint16`	rangeShift	`numTables × 16 − searchRange`

Tipo	Nombre	Notas
`Tag`	tableTag	4 bytes ASCII, p.ej. `head`, `glyf`
`uint32`	checksum	checksum de la tabla
`Offset32`	offset	desde el principio del archivo
`uint32`	length	la longitud real de la tabla, excluyendo bytes de relleno

Tabla	Clase	Por qué
Tabla offset	fijo	12 bytes, campos fijos
Registro	fijo	16 bytes, campos fijos
`head`	fijo	54 bytes, todos de ancho fijo
`maxp`	fijo*	fijo por versión (0.5 vs 1.0)
`hhea`	fijo	36 bytes
`OS/2`	fijo*	fijo por versión (0–5)
`hmtx`	variable	arreglo dimensionado por `hhea.numberOfHMetrics` + arreglo cola
`loca`	variable	`numGlyphs + 1` entradas; ancho de entrada definido por `head`
`glyf`	variable	longitud variable por glifo, dos formatos de glifo
`cmap`	variable	sub-tablas en varios formatos, enlazadas por offset
`name`	variable	arreglo de registros + bloque de almacenamiento de cadenas
`post`	variable*	encabezado fijo; v2.0 agrega un arreglo de nombres de glifos
`kern`	variable	opcional; múltiples formatos de sub-tabla

Tipo	Nombre	Notas
`uint16`	majorVersion	1
`uint16`	minorVersion	0
`Fixed`	fontRevision	versión del diseñador; almacenar en bruto si no se interpreta
`uint32`	checksumAdjustment	checksum de todo el archivo; ver spec
`uint32`	magicNumber	siempre `0x5F0F3CF5` (gancho de validación)
`uint16`	flags	campo de bits
`uint16`	unitsPerEm	grilla de diseño; 16–16384, potencia de 2 para TrueType
`LONGDATETIME`	created	`int64`, segundos desde 1904
`LONGDATETIME`	modified	`int64`
`int16`	xMin	bounding box del font (¡con signo!)
`int16`	yMin
`int16`	xMax
`int16`	yMax
`uint16`	macStyle	campo de bits
`uint16`	lowestRecPPEM	tamaño mínimo legible en píxeles
`int16`	fontDirectionHint
`int16`	indexToLocFormat	0 = `loca` corto, 1 = `loca` largo
`int16`	glyphDataFormat	0

Tipo	Nombre	Notas
`uint32`	version	`0x00005000`
`uint16`	numGlyphs	el único campo indispensable

Tipo	Nombre	Notas
`uint16`	maxPoints	máx. puntos en un glifo no compuesto
`uint16`	maxContours	máx. contornos en un glifo no compuesto
`uint16`	maxCompositePoints	máx. puntos en un glifo compuesto
`uint16`	maxCompositeContours	máx. contornos en un glifo compuesto
`uint16`	maxZones	1 = sin twilight zone; 2 = twilight zone en uso
`uint16`	maxTwilightPoints	máx. puntos en la twilight zone
`uint16`	maxStorage	máx. ubicaciones de área de almacenamiento
`uint16`	maxFunctionDefs	máx. definiciones de función
`uint16`	maxInstructionDefs	máx. definiciones de instrucción
`uint16`	maxStackElements	profundidad máxima del stack
`uint16`	maxSizeOfInstructions	máx. bytes de instrucciones de glifo
`uint16`	maxComponentElements	máx. componentes en un glifo compuesto
`uint16`	maxComponentDepth	máx. profundidad de anidamiento de glifos compuestos

Tipo	Nombre	Notas
`int16`	numberOfContours	≥ 0 → glifo simple; < 0 (usar −1) → glifo compuesto
`int16`	xMin	bounding box del glifo
`int16`	yMin
`int16`	xMax
`int16`	yMax

Tipo	Nombre	Notas
`uint16`	endPtsOfContours[numberOfContours]	último valor + 1 = cantidad total de puntos
`uint16`	instructionLength	bytes de hinting que siguen
`uint8`	instructions[instructionLength]	bytecode de hinting TrueType (se puede pasar opacamente)
`uint8`	flags[…]	un flag lógico por punto, comprimido (abajo)
—	xCoordinates[…]	codificado por delta, ancho según flags
—	yCoordinates[…]	codificado por delta, ancho según flags

Bit	Nombre	Significado
`0x01`	ON_CURVE_POINT	el punto está en la curva (vs. un punto de control Bézier fuera de curva)
`0x02`	X_SHORT_VECTOR	el delta x es de 1 byte (si no, 2 bytes o 0)
`0x04`	Y_SHORT_VECTOR	el delta y es de 1 byte
`0x08`	REPEAT_FLAG	el siguiente byte es un contador de repetición; repetir este flag ese número de veces adicionales
`0x10`	X_IS_SAME_OR_POSITIVE_X_SHORT_VECTOR	doble significado (abajo)
`0x20`	Y_IS_SAME_OR_POSITIVE_Y_SHORT_VECTOR	doble significado
`0x40`	OVERLAP_SIMPLE	los contornos pueden superponerse
`0x80`	reserved	establecer en 0

Tipo	Nombre	Notas
`uint16`	majorVersion	1
`uint16`	minorVersion	0
`FWORD`	ascender	(`int16`)
`FWORD`	descender	(`int16`, usualmente negativo)
`FWORD`	lineGap	(`int16`)
`UFWORD`	advanceWidthMax	(`uint16`)
`FWORD`	minLeftSideBearing	(`int16`)
`FWORD`	minRightSideBearing	(`int16`)
`FWORD`	xMaxExtent	(`int16`)
`int16`	caretSlopeRise	pendiente del cursor (rise/run); 1 para vertical
`int16`	caretSlopeRun	0 para vertical
`int16`	caretOffset	desplazamiento para resaltado inclinado; 0 si no es cursiva
`[4]int16`	(reserved)	establecer en 0
`int16`	metricDataFormat	0
`uint16`	numberOfHMetrics	dimensiona la tabla `hmtx`

Tipo	Nombre
`uint16`	advanceWidth
`int16`	lsb (left side bearing)

Bit	Nombre	Significado
`0x0001`	ARG_1_AND_2_ARE_WORDS	los args son de 16 bits (si no, de 8 bits)
`0x0002`	ARGS_ARE_XY_VALUES	los args son offsets (si no, índices de puntos)
`0x0004`	ROUND_XY_TO_GRID
`0x0008`	WE_HAVE_A_SCALE	sigue un `F2Dot14` de escala uniforme
`0x0020`	MORE_COMPONENTS	sigue otro componente; continuar el bucle
`0x0040`	WE_HAVE_AN_X_AND_Y_SCALE	siguen dos `F2Dot14`
`0x0080`	WE_HAVE_A_TWO_BY_TWO	siguen cuatro `F2Dot14` (matriz 2×2)
`0x0100`	WE_HAVE_INSTRUCTIONS	después del último componente: longitud `uint16` + bytes de instrucción
`0x0200`	USE_MY_METRICS
`0x0400`	OVERLAP_COMPOUND

Tipo	Nombre	Notas
`uint16`	platformID	0=Unicode, 1=Mac, 3=Windows
`uint16`	encodingID	específico de plataforma
`Offset32`	subtableOffset	desde el inicio de la tabla `cmap`

Tipo	Nombre	Notas
`uint16`	flags	flags del componente (abajo)
`uint16`	glyphIndex	el id del glifo componente
arg1, arg2	—	`int8`/`uint8` o `int16`/`uint16` según `ARG_1_AND_2_ARE_WORDS`; si `ARGS_ARE_XY_VALUES`, offsets de posición con signo, si no, índices de coincidencia de puntos
transform	—	0, 1, 2 o 4 × `F2Dot14` según los flags de escala

Tipo	Nombre	Notas
`uint16`	version	0 o 1
`uint16`	count	número de registros de nombre
`Offset16`	storageOffset	inicio del almacenamiento de cadenas, desde el inicio de la tabla

Tipo	Nombre	Notas
`uint16`	version	0–5
`int16`	xAvgCharWidth	promedio ponderado del ancho de avance de minúsculas
`uint16`	usWeightClass	100–900 (equivale a `font-weight` de CSS)
`uint16`	usWidthClass	1–9, condensado → expandido
`uint16`	fsType	flags de permisos de incrustación
`int16`	ySubscriptXSize
`int16`	ySubscriptYSize
`int16`	ySubscriptXOffset
`int16`	ySubscriptYOffset
`int16`	ySuperscriptXSize
`int16`	ySuperscriptYSize
`int16`	ySuperscriptXOffset
`int16`	ySuperscriptYOffset
`int16`	yStrikeoutSize
`int16`	yStrikeoutPosition
`int16`	sFamilyClass	clasificación IBM de familia tipográfica
`uint8[10]`	panose	clasificación PANOSE de 10 bytes
`uint32`	ulUnicodeRange1	bits de cobertura de bloque Unicode 0–31
`uint32`	ulUnicodeRange2	bits 32–63
`uint32`	ulUnicodeRange3	bits 64–95
`uint32`	ulUnicodeRange4	bits 96–127
`Tag`	achVendID	identificador de vendedor de 4 caracteres
`uint16`	fsSelection	flags de estilo (cursiva, negrita, regular, …)
`uint16`	usFirstCharIndex	codepoint Unicode más bajo del font
`uint16`	usLastCharIndex	codepoint Unicode más alto del font
`int16`	sTypoAscender	ascendente tipográfico (FUnits)
`int16`	sTypoDescender	descendente tipográfico (FUnits, usualmente negativo)
`int16`	sTypoLineGap	interlineado tipográfico (FUnits)
`uint16`	usWinAscent	métrica de ascendente Windows
`uint16`	usWinDescent	métrica de descendente Windows (valor positivo)

Tipo	Nombre	Notas
`uint32`	ulCodePageRange1	bits de cobertura de página de código 0–31
`uint32`	ulCodePageRange2	bits 32–63

Tipo	Nombre	Notas
`int16`	sxHeight	altura de la ‘x’ minúscula (FUnits)
`int16`	sCapHeight	altura de la ‘H’ mayúscula (FUnits)
`uint16`	usDefaultChar	índice de glifo para el carácter por defecto
`uint16`	usBreakChar	índice de glifo para el carácter de separación
`uint16`	usMaxContext	longitud máxima del contexto de glifo objetivo

Tipo	Nombre	Notas
`uint16`	usLowerOpticalPointSize	tamaño óptico inferior ×20
`uint16`	usUpperOpticalPointSize	tamaño óptico superior ×20

Tipo	Nombre	Notas
`uint16`	version	versión de sub-tabla (0)
`uint16`	length	longitud total en bytes (incluyendo este encabezado)
`uint16`	coverage	byte alto = formato (0 o 2); byte bajo = flags (ver abajo)

Tipo	Nombre	Notas
`uint16`	nPairs	número de pares kern
`uint16`	searchRange	`(mayor potencia de 2 ≤ nPairs) × 6`
`uint16`	entrySelector	`log2(mayor potencia de 2 ≤ nPairs)`
`uint16`	rangeShift	`nPairs × 6 − searchRange`

Tipo	Nombre	Notas
`uint16`	left	índice del glifo izquierdo
`uint16`	right	índice del glifo derecho
`int16`	value	ajuste de kern en FUnits

Tabla	Página	Tabla	Página
structure	`otff`	`cmap`	`cmap`
`head`	`head`	`name`	`name`
`maxp`	`maxp`	`post`	`post`
`hhea`	`hhea`	`OS/2`	`os2`
`hmtx`	`hmtx`	`kern`	`kern`
`loca`	`loca`	`glyf`	`glyf`

Parsear un Font

Parsear Archivos de Fuente TrueType (TTF) — Referencia

Contenido

1. Introducción

2. Modelo mental

3. Convenciones

Endianness

Tipos de datos

4. Estructura del archivo

4.1 Tabla de offsets (encabezado sfnt) — 12 bytes, en el byte 0

4.2 Directorio de tablas — numTables registros de 16 bytes, en el byte 12

5. Cómo parsear

5.1 La secuencia de parseo

5.2 Tablas de diseño fijo vs. variable — la estrategia de decodificación

6. Referencia de tablas

6.1 head — encabezado del font (54 bytes, fijo)

6.2 maxp — perfil máximo

6.3 hhea — encabezado horizontal (36 bytes, fijo)

6.4 hmtx — métricas horizontales (variable)

6.5 loca — índice de ubicación (variable)

6.6 glyf — datos de glifos (variable, el difícil)

Glifo simple (numberOfContours ≥ 0)

Glifo compuesto (numberOfContours < 0)

6.7 cmap — mapeo de carácter a glifo (variable)

6.8 name — cadenas legibles por humanos (variable)

6.9 post — datos PostScript (variable, dependiente de versión)

6.10 OS/2 — métricas OS/2 y Windows (fijo por versión)

6.11 kern — kerning (opcional, variable)

7. Fuentes

4.2 Directorio de tablas — `numTables` registros de 16 bytes, en el byte 12

6.1 `head` — encabezado del font (54 bytes, fijo)

6.2 `maxp` — perfil máximo

6.3 `hhea` — encabezado horizontal (36 bytes, fijo)

6.4 `hmtx` — métricas horizontales (variable)

6.5 `loca` — índice de ubicación (variable)

6.6 `glyf` — datos de glifos (variable, el difícil)

6.7 `cmap` — mapeo de carácter a glifo (variable)

6.8 `name` — cadenas legibles por humanos (variable)

6.9 `post` — datos PostScript (variable, dependiente de versión)

6.10 `OS/2` — métricas OS/2 y Windows (fijo por versión)

6.11 `kern` — kerning (opcional, variable)