博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

xuld/原创

Custom transformer (自定义转换器)是干什么的

简单说,TypeScript 可以将 TS 源码编译成 JS 代码,自定义转换器插件则可以让你定制生成的代码。比如删掉代码里的注释、改变变量的名字、将类转换为函数等等。

TypeScript 将 TS 代码编译到 JS 的功能,其实也是通过内置的转换器实现的,从 TS 2.3 开始,TS 将此功能开放,允许开发者编写自定义的转换器。

 

预备知识

语法树

语法树是用于表示语法的数据结构。具体请参考我的另一个篇文章:https://www.cnblogs.com/xuld/p/12238167.html 。

 

转换器原理

TS 源码会先被解析为语法树,然后通过弱干个转换器生成新的语法树,最后通过代码打印器将语法树转回源码。

转换器本质就是一个函数,这个函数接收一个语法树,并返回转换后的新语法树。

自定义转换器分 before 和 after,其中,before 是位于内置转换器之前(转换 TS 代码),after 是位于内置转换器之后(转换已处理的 JS 代码)。

 

如何使用转换器

官方的 tsc 命令不支持加载自定义插件,但还有很多方法使用自定义转换器:

  1. 直接调用 TS 编译器的 API 编译代码
  2. 使用社区提供的 TTypeScript 项目:https://github.com/cevek/ttypescript
  3. 使用 Webpack+TS-loader 编译项目,并且在 TS-loader 配置自定义转换插件:
{
    test: /\.ts$/,
    loader: 'ts-loader',
    options: { 
        getCustomTransformers(program) {
            return {
                before: [myTransformer],
                after: []
            }
        }
    }
}

其中,myTransformer 就是一个转换器。这里接收一个数组,可以传递多个转换器函数。

 

Hello world

按惯例先来一个简单的例子,教你如何写一个转换器。

 

目标:将下面源码中字符串的内容改成 “Hello world”

console.log("Hello xuld")

 

1. 新建一个 hello.js,内容如下:

const ts = require("typescript")

// 这是一个自定义转换器
function createTransformer() {
    return context => {
        return node => ts.visitNode(node, visit)

        function visit(node) {
            // 如果发现字符串,替换为自己的内容
            if (ts.isStringLiteral(node)) {
                return ts.createStringLiteral("Hello world")
            }
            // 其它节点保持不变
            return ts.visitEachChild(node, visit, context)
        }
    }
}

 

2. 测试自定义转换器

为学习方便,这里采用直接调用 TS API 的方案使用转换器

const ts = require("typescript")

// 要编译的源码
const source = `console.log("Hello xuld")`

// 编译源码
const result = ts.transpileModule(source, {
    transformers: { before: [createTransformer()] }
})

// 打印结果
console.log(result.outputText)

使用 node 执行以上代码可以看到最终的结果。

 

实现转换器

转换器的职责是接收一个语法树节点,然后返回生成的新节点,如果这个节点无需变化(多数情况),可以返回节点本身。

需要特别注意的是:转换器只会生成新的节点,而不会修改原有节点

这是因为一个节点会在多个地方被使用,而且很多地方针对节点作了缓存,为了确保系统稳定性,禁止修改节点可以避免很多意外的错误。

语法树是一种有层级的树结构,只要任何一个节点变化,这个节点的所有父节点都需要重新生成。为了避免每次重新创建大量节点浪费性能,TS 提供了 ts.visitNode,这个 API 接收一个节点和一个回调函数,然后将节点传递给回调函数,回调函数负责返回新节点,如果新节点和原节点相同,则重用旧节点,否则自动创建新的父节点。对用户而言,我们只需要使用 ts.visitNode 找出需要处理的节点并返回新节点,其它情况使用默认的 ts.visitEachChild 即可。

 

简而言之,无论你要做什么功能的转换器,不用在意原理,只要按这个模板填代码即可:

function createTransformer() {
    return context => {
        return node => ts.visitNode(node, visit)

        function visit(node) {
            // 其它代码不变,只需修改下面的部分
            // =======================================
            if (判断节点的类型(node)) {
                return 创建转换的节点(node)
            }
            if (判断节点的类型(node)) {
                return 创建转换的节点(node)
            }
            // =======================================

            return ts.visitEachChild(node, visit, context)
        }
    }
}

 

判断节点的类型

要判断节点的类型,可以通过 node.kind === SyntaxKind.xxx 比较,也可以通过 ts.isXXX(node):

 

如果你不清楚你要处理的这个语法对于的类型叫什么,可以使用 AstExplorer 。

 

创建转换的节点

创建转换后的新节点有两种方式:一种是最简单的,使用 ts.createXXX 创建;还有一种 ts.updateXXX 是基于已有的节点,如果节点发生变化则创建新节点,否则重用节点(主要为了节约内存损耗)。

 

比如要创建一个表示 a + 1 的节点:

ts.createBinary(ts.createIdentifier("a"), ts.SyntaxKind.PlusToken, ts.createNumericLiteral(1))

 

替换变量名

按以上的思路,替换变量名就需要:先找出变量名对应的节点,然后返回替换后的新变量名:

// 将代码中变量 foo 变成 goo  
if (ts.isIdentifier(node) && node.text === "goo") {
    return ts.createIdentifier("goo")
}

但这里有个问题,就是变量名、函数名、类名也都是 Identifier 类型的节点,上面代码会全部换掉,有时,我们只希望处理某些条件下的节点,这时可以添加更多的判断,比如只替换作为函数名调用的 foo() 中的 foo,但不替换其它场景:

if (ts.isIdentifier(node) && node.text === "goo" &&
ts.isCallExpression(node.parent) && node.parent.expression === node) { return ts.createIdentifier("goo") }

 

转换上下文

所有转换器都接收一个参数 context,表示转换的上下文。转换的上下文主要用于:

  1. 提供了一些实用的 API
  2. 在多个转换器之间共享数据
  3. 注册生成节点为字符串时的附加事件

自动生成变量 

目标:支持 case 语句中使用 it 关键字:

 源代码:

switch (1 + 1) {
    case it == 2:
}

转换后:

var _t_1;
_t_1 = 1 + 1 switch (true) { case _t_1 == 2: }

代码如下:

function createTransformer() {
    return context => {
        return node => ts.visitNode(node, visit)

        function visit(node) {
            if (ts.isSwitchStatement(node)) {
                // 创建临时变量
                const name = ts.createUniqueName("_t")
                // 插入变量
                context.hoistVariableDeclaration(name)
                // 生成两行代码
                return [
                    // 赋值变量
                    ts.createExpressionStatement(ts.createAssignment(name, node.expression)),
                    // 将 switch 的条件改为 true
                    ts.createSwitch(ts.createTrue(), ts.visitEachChild(node.caseBlock, child => visitSwitch(child, name), context))
                ]
            }
            // 其它节点保持不变
            return ts.visitEachChild(node, visit, context)
        }

        function visitSwitch(node, name) {
            // 将 it 变为新的变量名
            if (ts.isIdentifier(node) && node.text === "it") {
                return name
            }
            // 其它节点保持不变
            return ts.visitEachChild(node, child => visitSwitch(child, name), context)
        }
    }
}

思路:先创建一个临时变量,存放 switch 条件内容,然后将原始条件改成 true,并将内部 it 替换掉。

 

报错

在转换时,如果需要报错,可以使用 context.addDiagnostic(diag)

 

使用类型信息

在实际场景中,可能需要用到代码的类型信息(比如变量有没有定义,变量在哪些地方被使用,变量的类型)

转换器本身并没有直接提供这些信息,但可以通过 program.getTypeChecker() 获取到 TypeChecker,然后通过 TypeChecker 提供的丰富 API 获取到这些信息。

如果是采用了 ts-loader, program 对象通过 getCustomTransformer() 的参数得到。

 

[[[TODO: 更多的案例待阅读量超过1000后添加]]]

 

xuld/原创

更多案例

这里列了一些社区的现成插件,方便研究学习:

如果你想成为大厂前端架构师,如果你还有成长的激情, 

欢迎关注“我是前端架构师”微信公众号