【MindSpore易点通·漫游世界】在Jetson AGX Orin上源码编译安装MindSpore 1.8.0 GPU版

上次 张小白使用 gcc 9.4.0源码编译 MindSpore 1.8.0 CUDA11的版本失败了:https://bbs.huaweicloud.com/forum/thread-193443-1-1.html

于是张小白提了一个问题贴:https://bbs.huaweicloud.com/forum/thread-193443-1-1.html

专家提示:用gcc 7.3.0试下呢?

那就试试吧。

 

下载mindspore r1.8分支源码:

git clone  http://gitee.com/mindspore/mindspore.git -b r1.8

修改 mindspore/scripts/build/build_mindspore.sh:

在Xoff那一行增加 -DENABLE_GITEE=ON 强制使用gitee

因为gcc7.3.0好像被破坏了,所以重新源码编译下:

cd /home/zhanghui

ln -s /home1/zhanghui/gcc-7.3.0

cd /home1/zhanghui/gcc-7.3.0

make -j12

sudo make install

cd /usr/bin

sudo rm g++

sudo rm gcc

sudo ln -s /usr/local/bin/g++ g++

sudo ln -s /usr/local/bin/gcc gcc

cd

gcc --version

g++ --version

开始正式编译:

cd /home1/zhanghui/mindspore

./build.sh -e gpu -j12

成功完成编译。

cd output

可以看到生成好的whl

创建conda环境:

conda create -n mindspore1.8 python=3.9

conda activate mindspore1.8

安装已编译的whl

pip install ./mindspore_gpu-1.8.0-cp39-cp39-linux_aarch64.whl -i https://pypi.tuna.tsinghua.edu.cn/simple

python -c "import mindspore;mindspore.run_check()"

这个很奇怪的现象又出现了。

在conda环境中,报错:ModuleNotFoundError: No module named 'packaging'

退出conda环境:conda deactivate

重新 python -c "import mindspore;mindspore.run_check()"

说明一个很奇怪的事情,虽然在conda环境里面做pip install,但是好像还是装到了base环境。

python test.py

这说明gcc 7.3.0可以正常完成mindspore 1.8.0的编译和安装。。。

gcc 9.4.0暂时不行。

张小白不甘心,还是决定在conda环境试一试,先确认下base环境和conda环境的版本:

显然是两个不同的环境。

然后,在原来直接pip install的基础上,换成使用python -m pip install的方式安装:

这次居然有把packaging的包装进去。看来原因是前面pip install仅仅装到了base环境。

再试下两种检验方式:

另一种方式:

终于都没问题了。

这倒是解决了  https://bbs.huaweicloud.com/forum/thread-193449-1-1.html 在安装1.7.0过程中出的问题。

但是至于gcc 9.4.0为啥编译报错,这个问题还是留给mindspore团队吧!

(全文完,谢谢阅读)

posted @ 2022-08-12 11:17  Skytier  阅读(65)  评论(0编辑  收藏  举报