深入理解npm scripts

故事要从改造公司项目脚手架说起，去年(2022年)我在部门做了vite技术分享，会后与前端基建同学聊了一下，打算将公司脚手架的构建工具由webpack升级成vite，提升开发体验，生产环境依然采用webpack。迎来的第一个问题就是如何解决node版本隔离问题？公司目前大多数项目node版本都是8.9.4，而vite要求node版本最小是12.0.0,当然开发同学可以本地自行安装高版本，但是存在以下弊端：

操作繁琐，开发需要手动安装
污染全局，可能导致其他项目无法运行
不够优雅，不能无缝切换
心智负担，频繁切换node版本

其实这个问题已经有解决方案了，并且公司一直在使用这个方案，就是使用volta(点我了解一下)来做到项目级别的node版本控制。但是目前的问题是：volta已经用于生产环境打包，没法在一个项目里边设置多个node版本（当然手动切换版本也可以，但比较繁琐）。如果我们直接修改volta的配置，虽然可以满足运行vite版本要求但也导致生产环境node版本被改了，结果具有不可预测性，显然不是一个好的做法。

那我们能否从volta、nvm、n等node版本管理解决方案上得到一些启发呢？比如在运行npm scripts时候指定node的版本，如果不存在就从网络下载zip包，解压得到可执行文件。运行指定路径的node可执行文件。实际以上这些工具就是这么干的，实现思路大同小异。

在经过一番调研后，发现其实社区已经有解决方案了，这里列举2个npm包，这两个包都可以做到项目级别的node版本控制，使用方式和工作原理也很类似，但是他们有一个很大的区别：

nodeinstall 同时安装node与npm，可指定node下载镜像与执行路径

node 只安装node，不提供参数配置

在经过一番demo测试后，发现确实可以做到项目隔离，不会影响全局node。看文档得知以下2点重要结论：

下载npm包(包含了node二进制可执行文件)到本地
npm scripts会优先去本地node_modules中的.bin目录寻找环境变量

首先验证一下结论1，查看一下node_moduls/.bin文件夹里都有啥，发现眼熟的node其实是一个软连接！其真实路径为node_modules/node/bin/node

细心的同学可能发现了，.bin目录下的文件全是软连接

接着验证结论2，分别在全局执行node -v和使用npm scripts执行node -v，结果如下：

可以看到，两者的node版本不一样！

经过一番验证，确实如文档描述一样。那么有意思的事情就来了，这里要提出几个问题：

为什么终端可以运行js脚本
node_modules下的.bin文件夹是干什么用的
为什么运行npm scripts会优先使用本地的node

带着疑问，我们一步步揭开npm的神秘面纱。

当我们输入npm run xxx，敲下回车的时候，都发生了什么？

首先我们知道一个命令想要执行，至少先要找到命令的位置，其次还得是可执行文件/脚本，那我们就顺藤摸瓜，看看npm命令的执行流程就能找到最终答案。

找到npm本尊以后，这里我通过vscode断点调试，整理其核心实现如下：

将项目node_modules/.bin 与npm全局安装位置下的node-gyp-bin添加到PATH环境变量最前端（注意追加顺序，node-gyp-bin在node_modules/.bin之前），为什么要追加到最前面？这里就要涉及到一点操作系统的知识了。

简单来说，PATH最重要的功能就是为系统查找命令/变量提供一个规则。当我们在终端输入一个指令的时候，系统就会去PATH中去查找，而查找的优先级就是从左到右。

设置好环境变量以后，就开始运行npm script了，核心实现可以看到是利用node子进程去执行命令

通过源码分析得出结论：

npm会在运行之前为追加PATH路径
然后使用node子进程执行命令

再来验证一下，是否符合预期，查看系统PATH环境变量

运行npm scripts时候，输出系统PATH环境变量

可以看到多出来两个环境变量，就是前边提到的最前端追加变量。到这一步已经可以解释为什么我们运行node命令的时候会优先从项目node_modules/.bin目录中去查找，以及.bin目录是干什么用的

那再来说说，为什么终端能运行js代码？这里以vite为例，可以看到vite的真实路径是 node_modules/vite/bin/vite.js

打开这个文件，可以看到引入眼帘的第一句就是一行类似‘注释’的代码，不要小看这一句’注释‘，他包含了两个部分：

#! 它叫shebang，起到标识的作用，说明这个文件可以当做脚本来运行
/usr/bin/env就是告诉系统可以在PATH目录中查找

所以配置#!/usr/bin/env node, 就是告诉系统去PATH环境中查找命令，使用node解释执行。同时也解决了不同的用户node路径不同的问题，可以让系统动态的去查找node来执行你的脚本文件，这也解释了为什么我们在写cli的时候需要在第一行加入这段`注释`

最后顺便谈谈 npm hooks，写了如下demo

可以看到不仅是内置install、publish有钩子，其实可以自定义npm hook，只要满足命名规则就可以。

npm hooks处理核心代码，最关键的一句。如果当前scripts不是以pre或者post开头的，则在当前命令前后追加pre和post命令，然后顺序执行

以上疑问都已解答，看到这里相信你对npm的执行流程应该有一个清晰的认识了。

那最终我是如何实现node版本隔离的呢？由于`node`这个npm包无法指定node安装路径，这会导致运行所有npm scripts都会默认去.bin目录寻找node，在部署生产环境的时候不希望使用本地node。

前面说过nodeinstall可以指定execPath参数，利用这个就可以指定一个node安装路径，这样就不会影响到项目其他npm脚本执行所用的node版本。有了node可执行文件，接下来就是解决在运行npm scripts的时候如何指定我们安装的本地node，这里使用node子进程的fork方法就可以实现，其可以指定execPath（既node可执行文件位置），这样就达到了最终效果。

2023第一篇文章，加油！

posted @ 2023-02-13 16:48 zt123123 阅读(220) 评论(0) 编辑收藏举报

刷新页面返回顶部

学不动了

好好学习，天天向上

深入理解npm scripts

公告