百闻不如一试——公式图片转Latex代码
写博客时,数学公式的编辑比较占用时间,在上一篇中详细介绍了如何在Markdown
中编辑数学符号与公式。
https://www.cnblogs.com/bytesfly/p/markdown-formula.html
当然,有时候我们仅仅是想把现成的公式搬到markdown
中来编辑,此时如果有工具能把公式截图直接解析成Latex
代码就方便了。
刚好这几天看到好几个微信公众号都在推送image-to-latex
这个开源项目:
https://github.com/kingyiusuen/image-to-latex
Convert images of LaTex math equations into LaTex code.
该项目当前(2021年09月02日)star人数为631,Fork为81:
最近正好也是在了解机器学习、深度学习相关的东西,于是打算上手感受一下转换效果。
百闻不如一试
其实image-to-latex
这个项目的README
写得算是比较清楚了,介绍了项目的来龙去脉、可以改进的地方、如何使用等等。
快速开始
下面我把自己第一次尝试的过程简单记录如下:
- 克隆项目
git clone --depth=1 https://github.com/kingyiusuen/image-to-latex.git
cd image-to-latex
多啰嗦一句:
--depth: 用来指定克隆的深度,1表示克隆最近的一次commit。这种方法克隆是为了减小项目体积的,加快克隆速度,对于那种庞大且活跃的开源项目非常有效。
- 准备Python环境
该项目依赖Python环境,由于我用的是conda
来管理虚拟环境的,不是用venv
,所以这里的步骤可能与README
上的有一点点差异。
此时应该是在项目目录下,即image-to-latex
目录,该目录下有requirements.txt
文件。
# 创建新的python3.6环境
conda create --name latex python=3.6
# 激活环境
conda activate latex
# 安装依赖
pip install -r requirements.txt
关于Python环境的搭建,可以参考我之前的博客:
https://www.cnblogs.com/bytesfly/p/python-environment.html
- 下载模型
For example, you can use the following command to download my best run.
到了这步本该是模型训练(Model Training
),我这里仅想体验一下,可以直接下载别人已经训练好的模型。
python scripts/download_checkpoint.py kingyiusuen/image-to-latex/1w1abmg1
此时shell显示如下:
(latex) ➜ python scripts/download_checkpoint.py kingyiusuen/image-to-latex/1w1abmg1
wandb: (1) Create a W&B account
wandb: (2) Use an existing W&B account
wandb: (3) Don't visualize my results
wandb: Enter your choice: 3
wandb: You chose 'Don't visualize my results'
Downloading model checkpoint...
Model checkpoint downloaded to image-to-latex/artifacts/model.pt.
下载需要稍微等等,模型有将近2个G的大小。
- 启动服务
(1) 启动后端服务,执行命令make api
An API is created to make predictions using the trained model.
看下项目的Makefile
文件,其实make api
就是调用了下面的启动命令:
uvicorn api.app:app --host 0.0.0.0 --port 8000 --reload --reload-dir image-to-latex --reload-dir api
浏览器打开 http://localhost:8000/docs ,看到接口文档如下:
(2) 启动前端界面,执行命令make streamlit
同样,看下项目的Makefile
文件,其实make streamlit
调用了下面的启动命令:
streamlit run streamlit/app.py
浏览器打开 http://localhost:8501/ ,就是上传图片的界面:
至此,image-to-latex
就成功启动了,下面就期待转换公式的效果了!
上手体验
下面我作为一个小白用户,体验一下image-to-latex
的转换效果。
我从之前的博客中截图了10个公式,使用下来,感觉当前的效果并非太理想。注意,个别解析出来仅是缺少了右}
,这种也可以算解析出来了。如下:
测试来看,貌似对多行公式的解析不太好。当然了,有这样的免费工具来辅助我们把公式图片转成Latex
代码已经让人挺惊喜了。相信以后随着更多的人参与算法的优化、模型的改善,解析的效果会更好。
写在后面
I found a pretty established tool called Mathpix Snip that converts handwritten formulas into LaTex code.
image-to-latex
这个项目的README
里也提到了mathpix
这个更加成熟的工具。免费版每月能识别50次公式图片。详情见:
下载试了下,识别的效果确实不错。(注意:非广告,本人与mathpix
无任何关系,仅仅试了下而已!!!)
百闻不如一试,动手尝试之后才有发言权。后面有时间会看看image-to-latex
的代码实现,学习学习。