Datewhale学习笔记0
$\textcolor{blue}{Datewhale学习笔记}$$\textcolor{blue}{Chapter 0 }$🔞
$\textcolor{red}{安装Installation}$
安装清单
Miniconda 安装配置
下载 Miniconda
最新版 Miniconda For Windows 下载链接
Windows 下安装配置推荐
- Just Me (recommended)
- Clear the package cache upon completion
修改 Powershell 执行策略(可选)
在开始
图标右键单击,选择 Windows PowerShell(管理员)
如果出现上述图片现象先输入下面的内容,并回车:
Set-ExecutionPolicy -Scope CurrentUser RemoteSigned
出现如下内容后,输入:A
,回车:
重新启动后出现下面图片情况及算配置成功:
最后在 Anaconda Powershell Prompt 中输入:
conda init
更换镜像源
- Pip 换源
- Conda 换源
加快国内资源下载速度
校园网联合镜像站
https://help.mirrors.cernet.edu.cn/
阿里巴巴开源镜像站
https://developer.aliyun.com/mirror/
请避免使用代理,不合理的代理设置会导致下载失败
Conda 更换镜像源
清华大学开源软件镜像站:https://help.mirrors.cernet.edu.cn/anaconda/
南方科技大学开源软件镜像站:https://help.mirrors.cernet.edu.cn/anaconda-extra/
在 Anaconda Powershell Prompt 中输入:
conda config --set show_channel_urls yes
在镜像站复制文本后,在 Anaconda Powershell Prompt 中输入:
notepad .condarc # 注意有个小点 "." 在 "condarc" 的前面
粘贴刚刚复制的文本,保存文件后关闭
最后在 Anaconda Powershell Prompt 中输入:
conda clean -i # 清除源缓存,以启用镜像源
PyPI 更换镜像源
校园网联合镜像站:https://help.mirrors.cernet.edu.cn/pypi/
复制文本后,在 Anaconda Powershell Prompt 中粘贴运行即可:
# 设置 PyPI 镜像源
pip config set global.index-url https://mirrors.cernet.edu.cn/pypi/web/simple
课程环境搭建
(1)创建与激活Conda 环境
创建 Conda 环境
conda create -n Datawhale python=3.10 # conda 环境创建
其中 -n 代表创建的环境名称,这里是 Datawhale,并指定 Python 版本为 3.10
激活刚刚创建的 Conda 环境:
conda activate Datawhale # 激活 Datawhale 环境,不同环境的 Python 包版本不同!
如果需要删除某个 Conda 环境:
conda deactivate # 退出该环境
conda remove -n Datawhale --all # 删除整个环境
- 这里我使用的是win11(win10系统的同学可以自己找一下高级选项,或者询问度娘)
- windows图标右键-->系统 -->高级系统设置
- 上方选项卡“高级” --> “环境变量”按钮
- 对“Path”进行设置
- 新建对应环境变量
- 注意:我的miniconda安装路径为“
D:\MiniConda
”,设置时修改为自己的安装路径
D:\MiniConda
D:\MiniConda\Scripts
D:\MiniConda\Library\bin
(2)conda 换源(镜像服务器)
由于 miniconda 下载文件/依赖库等默认的采用国外的服务器,下载速度很慢,一般改为国内的清华源/阿里源等方式解决。这里安装的是清华源。
- “Win”+R 打开“运行”,输入cmd进入cmd终端,依次输入以下两行(每输入一行后回车)
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
- 第一行代码添加清华源 第二行代码生成".condarc"文件
- 打开
C:\Users\"用户名"\.condarc
找到该文件
- 将第一步中清华源下载界面的内容复制进去然后保存
-
在PowerShell中输入以下代码清除索引缓存,就可以使用了
conda clean -i
(3)conda安装成功验证
- 安装成功后,输入查看conda环境/版本相关信息
conda info
conda --version
- 若出现以下界面,说明安装成功
(4)pip换源
- pip 是Python安装第三方包的管理工具,该工具提供了对Python 包的查找、下载、安装、卸载的功能。我们安装完conda环境pip就是最新的了
- 复制文本后,在 Anaconda Powershell Prompt 中粘贴运行创建pip.ini文件
# 设置 PyPI 镜像源
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
- 这里我用的清华源,复制以下配置项到pip.ini文件中即可
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
[install]
trusted-host = https://pypi.tuna.tsinghua.edu.cn
(5)创建与激活conda环境
- 打开Anaconda Powershell Prompt输入以下命令
- 第一次激活 conda 虚拟环境需要初始化
conda init
- 创建conda环境
- 其中 -n 代表创建的环境名称,这里是 Datawhale,并指定 Python 版本为 3.11
conda create -n Datawhale python=3.11
- 激活conda环境
conda activate Datawhale
- 如果需要删除某个 Conda 环境:
conda deactivate # 退出该环境
conda remove -n Datawhale --all # 删除整个环境
安装Jupyter
下面提供两种安装Jupyter的方法(推荐conda安装)
1.conda安装Jupyter
打开**Anaconda Powershell Prompt**输入以下命令
- 进入虚拟环境(这里用的刚刚的Datawhale环境)
- 安装Jupyter
conda install jupyter notebook
-
安装成功以后菜单会出现notebook
-
点击运行即可
- 运行成功会自动跳转到浏览器
2.pip安装Jupyter
-
命令行运行代码,第二行出现的就是刚刚配置的清华源
pip install jupyter
-
在指定路径输入会跳转到浏览器
jupyter-notebook
-
结束学习时关掉命令行窗口或者使用:
Ctrl + C # 关闭 Jupyter Notebook 服务
3.Jupter默认空间设置
运行 Jupyter 后会出现一堆文件夹,这是你的\Home
目录里面的目录文件,如果不希望今后编写的 Jupyter Notebook 文件都直接放在该目录下,就需要修改 Jupyter Notebook 的存放路径。
打开文件,查找c.NotebookApp.notebook_dir
,删除注释符号,并将目标文件夹路径复制黏贴到后面的''
中。保存文件。
- 获取配置文件路径
jupyter notebook --generate-config
- 打开文件,CTRL + F 找到notebook_dir,删除注释符号,并将目标文件夹路径复制黏贴到后面的
''
中。保存文件。
Pip 安装与展示
Pip 安装课程所需第三方库
pip install jupyter
在指定路径输入:
jupyter-notebook # 会自动跳转到浏览器
结束学习时使用:
Ctrl + C # 关闭 Jupyter Notebook 服务
安装清单
数据挖掘:
- scikit-learn
- numpy
- pandas
- tqdm
- lightgbm (数据挖掘模型)
CV:
- nibabel
- pillow
Conda 安装与展示
首先在 Anaconda Powershell Prompt 中输入:
nvidia-smi # 查看当前 GPU 支持的最高 CUDA 版本
Pytorch 安装: https://pytorch.org/get-started/locally/
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
PaddlePaddle 安装:https://www.paddlepaddle.org.cn
conda install paddlepaddle-gpu==2.4.2 cudatoolkit=11.7 -c Paddle -c conda-forge
CUDA 验证
在 Anaconda Powershell Prompt 中输入:
ipython # 交互 Python 运行环境
使用 exit
或 exit()
来退出 IPython
PaddlePaddle:
>>> import paddle
>>> paddle.utils.run_check()
正确输出:
PaddlePaddle works well on 1 GPU.
PaddlePaddle is installed successfully! Let's start deep learning with PaddlePaddle now.
Pytorch:
>>> import torch
>>> torch.cuda.is_available()
正常输出:
True
云端环境的使用
- 百度飞桨 AI Studio https://aistudio.baidu.com/aistudio/index
- 阿里天池 PAI DSW https://tianchi.aliyun.com/notebook-ai
- Kaggle https://www.kaggle.com/code
- Google Colab https://colab.research.google.com/
- Sagemaker Studio Lab https://studiolab.sagemaker.aws/
$\textcolor{red}{本文部分引用自网络}$
$\textcolor{red}{文章架构来源于课程ppt(免责声明)}$
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
· 字符编码:从基础到乱码解决
· 提示词工程——AI应用必不可少的技术