【MindSpore易点通·漫游世界】在Jetson AGX Orin上源码编译安装MindSpore 1.8.0 GPU版
上次 张小白使用 gcc 9.4.0源码编译 MindSpore 1.8.0 CUDA11的版本失败了:https://bbs.huaweicloud.com/forum/thread-193443-1-1.html
于是张小白提了一个问题贴:https://bbs.huaweicloud.com/forum/thread-193443-1-1.html
专家提示:用gcc 7.3.0试下呢?
那就试试吧。
下载mindspore r1.8分支源码:
git clone http://gitee.com/mindspore/mindspore.git -b r1.8
修改 mindspore/scripts/build/build_mindspore.sh:
在Xoff那一行增加 -DENABLE_GITEE=ON 强制使用gitee
因为gcc7.3.0好像被破坏了,所以重新源码编译下:
cd /home/zhanghui
ln -s /home1/zhanghui/gcc-7.3.0
cd /home1/zhanghui/gcc-7.3.0
make -j12
sudo make install
cd /usr/bin
sudo rm g++
sudo rm gcc
sudo ln -s /usr/local/bin/g++ g++
sudo ln -s /usr/local/bin/gcc gcc
cd
gcc --version
g++ --version
开始正式编译:
cd /home1/zhanghui/mindspore
./build.sh -e gpu -j12
成功完成编译。
cd output
可以看到生成好的whl
创建conda环境:
conda create -n mindspore1.8 python=3.9
conda activate mindspore1.8
安装已编译的whl
pip install ./mindspore_gpu-1.8.0-cp39-cp39-linux_aarch64.whl -i https://pypi.tuna.tsinghua.edu.cn/simple
python -c "import mindspore;mindspore.run_check()"
这个很奇怪的现象又出现了。
在conda环境中,报错:ModuleNotFoundError: No module named 'packaging'
退出conda环境:conda deactivate
重新 python -c "import mindspore;mindspore.run_check()"
说明一个很奇怪的事情,虽然在conda环境里面做pip install,但是好像还是装到了base环境。
python test.py
这说明gcc 7.3.0可以正常完成mindspore 1.8.0的编译和安装。。。
gcc 9.4.0暂时不行。
张小白不甘心,还是决定在conda环境试一试,先确认下base环境和conda环境的版本:
显然是两个不同的环境。
然后,在原来直接pip install的基础上,换成使用python -m pip install的方式安装:
这次居然有把packaging的包装进去。看来原因是前面pip install仅仅装到了base环境。
再试下两种检验方式:
另一种方式:
终于都没问题了。
这倒是解决了 https://bbs.huaweicloud.com/forum/thread-193449-1-1.html 在安装1.7.0过程中出的问题。
但是至于gcc 9.4.0为啥编译报错,这个问题还是留给mindspore团队吧!
(全文完,谢谢阅读)