纯c#字体处理库（FontParser） -- 轻量、极速、跨平台、具有字体子集化功能

关于字体库与 FontParser 的开发历程
　　字体库是用于处理和渲染字体的软件工具，其功能通常涵盖字体文件的加载、解析、字形渲染和文本布局等核心模块。在众多字体库中，FreeType 是被广泛应用且极具影响力的开源项目，已成为事实上的行业标准。

　　然而，FreeType 基于 C++ 开发，这使得对于 C# 用户来说并不友好，尤其是在集成和使用上存在一定的门槛。此外，FreeType 缺乏字体子集化功能，这一短板在某些场景下会限制其应用范围。在我的多个开发项目中，虽然 FreeType 功能强大，但在实际使用过程中，我也遇到了诸多不便。

　　基于这些痛点，我萌生了用 C# 独立开发一套字体处理库的想法。经过数周的深入钻研和技术攻坚，我终于成功开发出了纯 C# 版本的字体处理库——FontParser。这一成果不仅填补了 C# 在字体处理领域的空白，也为广大 C# 开发者提供了一个更加便捷、高效的字体处理解决方案。

字体库应具备的基本功能：
1 字体文件名称获取
　　能够获取字体文件的名称，包括字体家族名称（Family）、子家族名称（Subfamily）等关键信息，以便用户快速识别和区分不同的字体样式。
2 字形索引与字符编码对照
　　提供字形索引（Glyph ID）与 Unicode 编码之间的映射关系，确保能够准确地将字符编码转换为对应的字形索引，从而实现正确的文字渲染。
3 字形渲染路径获取
　　根据字形索引，能够提取字形的轮廓路径（Outline Path），用于生成高质量的矢量图形渲染，支持字体的动态缩放和显示。
4 子集化功能
　　支持将字体文件中的部分字形抽取出来，生成一个新的字体子集文件。这一功能可以显著减少字体文件的大小，优化资源占用，特别适用于网页字体加载、嵌入式设备或移动应用等场景。

下文详细介绍各个功能的用法。

1 字体文件名称获取

　　字体文件名称存储在字体“name”表中，这里的字体名称是广义的字体名称，包括版权信息、制造商名称等信息。name表结构如下：

FontParser定义了如下结构，对应name表结构

class NameRecord
 {
        public EN_PlatformID platformID { get; set; }//  Platform ID.
        public ushort encodingID { get; set; }     // Platform-specific encoding ID.
        public ushort languageID { get; set; }     //  Language ID.
        public EN_FontNameId nameID { get; set; }  //  Name ID.
}

2 字形索引与字符编码对照

　　每个字符都有对应的字形，字形描述是由贝塞尔曲线和直线组成。通过字形索引就能找到字形描述。字形索引表位于loca表，字形与字符对照关系位于cmap表。通过字体文件中的 cmap 表（字符映射表），可以判断字体文件是否包含某个字符。cmap 表定义了字符代码与字形索引之间的映射关系，使得计算机能够根据字符编码找到对应的字形进行渲染。

cmap 表的作用
　　字符映射：cmap 表将字符编码（如 Unicode 编码）映射到字体中的字形索引（Glyph ID）。如果某个字符编码在 cmap 表中没有对应的字形索引，则表示该字体文件不支持该字符。
　　支持多种编码格式：cmap 表支持多种格式，常见的有格式 4 和格式 12。格式 4 适用于 16 位编码（如 Unicode BMP），而格式 12 支持 32 位编码，能够覆盖更广泛的 Unicode 字符集。
　　判断字符支持情况：通过检查 cmap 表，可以快速判断字体文件是否包含某个特定字符。如果字符编码在 cmap 表中映射到字形索引 0（.notdef），则表示该字符不被支持。

3 字形渲染路径获取

　　字形轮廓是由一系列点码组成，这些点码组成两种曲线：直线和贝塞尔曲线。根据这些曲线就能渲染出字符。

字形信息存在glyf表中，freetype提供了接口，可以读取字形信息。但是freetype提供的接口很不友好，需要经过复杂的处理才能获取字形描述信息。FontParser对此做了进一步的封装，可以直接获取字形信息描述。

 internal string GetGlyphPath(int glyphIndex, float fontSize)
 {
     int offset = _locaTable[glyphIndex];
     int length = _locaTable[glyphIndex + 1] - offset;
     if (length <= 0)
     {
         return string.Empty;
     }

     string path = _fontGlyph.GetGlyphPath(offset, length, fontSize);
     return path;
 }

4 子集化功能

　　字体子集化（Font Subsetting）是指从一个完整的字体文件中提取出仅包含特定字符集的子集，从而生成更小的字体文件。这一功能在多种应用场景中具有重要意义，尤其是在需要优化字体文件大小、减少加载时间和资源占用的场景中。

　　FreeType 本身并不直接支持字体子集化功能，但可以通过一些外部工具（如 ttx 和 fonttools）实现。然而，对于需要跨平台且使用 C# 的开发者来说，FreeType 的局限性较为明显。FontParser 的出现填补了这一空白。它是一款用 C# 开发的字体处理库，具备以下特点：
　　跨平台：支持 Windows、Linux 和 macOS，无缝集成到 .NET 项目中。
　　简单易用：提供简洁的 API 接口，便于开发者快速上手。
　　强大的子集化功能：能够从字体文件中提取特定字符集，生成更小的子集字体文件，显著节省资源。

internal byte[] CreateFontSubset_MinFast()
{
    List<int> glyphsUsed = _gylphIndexToChar.Keys.ToList();

    TTFFontData fontData = GetFontData(FontName);

    TTFFontSubset_MinFast fontSubset = new TTFFontSubset_MinFast();
    for (int i = 0; i < glyphsUsed.Count; i++)
    {
        int index = glyphsUsed[i];
        int newIndex = _gylphIndexToNew[index];
        fontSubset.AddGlyphIndex(index, newIndex);
    }

    byte[] subsetData = fontSubset.Subset(fontData);
    return subsetData;
}