Python、R、Julia混合编程环境配置及相关工具安装
1 Python环境配置
1.1 安装Anaconda
- Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。
- Conda 是为 Python 程序创建的,适用于 Linux,OS X 和Windows,也可以打包和分发其他软件。
- 目前最流行的 Python 环境管理工具。
- Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。
Anaconda下载地址:https://www.anaconda.com/download/

最好是64位的版本(除非你的电脑是32位的)。这里选择3.X或者2.X没关系,都可以,但建议选Python3版本。
检查并配置环境变量
Windows环境变量:
请查看环境变量中是否有以下三个路径,若没有请自行添加:
- 默认路径本身;
- 默认路径+”\Scripts”;
- 默认路径+”\Library\bin”
默认路径即为安装Anaconda时所设置的路径。例如:默认路径为:”C:\Users\Administrator\Anaconda3”,那么需要添加的三个路径则是:
- C:\Users\Administrator\Anaconda3;
- C:\Users\Administrator\Anaconda3\Scripts;
- C:\Users\Administrator\Anaconda3\Library\bin
第一个路径是Miniconda的根目录,也是最重要的路径!
1.2 添加conda的国内国内镜像服务器
因为conda下载文件要用到国外的服务器,速度一般会比较慢,我们可以通过增加一个清华的镜像服务器来解决。
打开cmd终端或者Anaconda Prompt(快捷键: win+r :然后输入cmd,回车)。
分别在cmd终端或者Anaconda Prompt里粘贴下面两行代码(每粘贴一行回车确认)。
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
1.3 创建Python虚拟环境
在 cmd 终端输入: conda create –n 环境名称 python=版本号
例如创建名称为course_py35,版本为python3.5的虚拟环境,cmd输入:conda create –n course_py35 python=3.5
。
安装工具包的时候可能需要安装一些其他的工具,如果系统提示 proceed ([y]/n)? ,输入y, 回车就ok。
出现如下图提示 “To activate this environment……”表示环境配置成功

尝试触发刚创建的这个环境,输入: activate course_py35
这里如果你用的是其他的名字,输入activate 名称
就可以了
如果命令行出现(course_py35)或者说是你自己设定的名称,表示已经载入这个环境

你可以选择查看 Python 的版本是否是我们刚创建的3.5版本,输入:python
不出意外的话,系统会给你反馈 python 的版本信息
输入:quit()
退出 python 环境(注意:此处的括号为英文状态下输入的)
1.4 安装所需的 python 工具包
可选择用conda或者pip安装包,为方便起见,先对conda和pip进行升级,cmd输入命令:
conda update conda
python -m pip install --upgrade pip
包安装命令:
conda install package_name
pip install package_name
包升级命令:
conda update package_name
pip install --upgrade package_name
包移除命令:
conda uninstall package_name
pip uninstall package_name
数据科学python常用包:
numpy:为大型多维数组和矩阵添加Python支持,以及在这些数组上运行高级数学函数的大型添加包。
scipy:用于科学计算的基础库。
pandas:为Python中的数据结构、数据操作和分析编写的添加包。
matplotlib:用于图形和数据可视化的全面2D绘图。
seabron:基于matplotlib的Python可视化库。它提供了一个高级界面,用于绘制有吸引力的统计图形。
scikit-learn:一个机器学习库。
networkx:复杂网络分析库。
statsmodels:用于构建统计模型。
beautiful soup:用于网络爬虫。
tweepy:用于Twitter抓取。
bokeh :一个Python交互式可视化库,面向现代Web浏览器进行演示。它的目标不仅是以D3.js的风格提供优雅、简洁的新颖图形结构,而且还通过非常大或连续传播的数据集提供高性能交互功能。它有Python、Scala、Julia以及现在的R接口。
2 R环境配置
2.1 R下载与安装
R官网地址:https://www.r-project.org/
R下载地址:https://cran.r-project.org/mirrors.html
为保证下载速度,可选择国内镜像地址
检查环境变量
环境路径:“默认路径\bin\x64”
CMD下输入R可进入R的控制台界面,如下图:

2.2 R语言安装R package:
(1)自动安装(在线安装)
在R的控制台输入:install.packages("package_name")
这种方法可能找不到需要的package,那么可以用 方法2
(2)手动安装(离线安装)
Windows:
下载package.zip文件
打开R的菜单栏->Packages->“Install package from local zip file…”
选择package.zip文件

查看全部安装的R包:.packages(all.available=T)
查看某个安装的R包:
library("XML")
help(package="XML")
R下常用包:
ggplot:基于R的ggplot2和图形语法的Python绘图系统。它专为使用最少的代码快速制作具有专业外观的图而构建。
对于R,查看添加包的最佳方法是查看CRAN任务视图,其中,添加包按使用类型聚合。
https://cran.r-project.org/web/views/
例如,有关高性能计算的CRAN任务视图,请访问:
https://cran.r-project.org/web/views/HighPerformanceComputing.html
3 Julia环境配置
3.1 Julia下载与安装
Julia下载地址:https://julialang.org/
julia最新版本为julia-1.0.3,建议安装最新版本
环境变量路径:"默认路径\Julia-1.0.3\bin"
启动:cmd输入julia,如下图:

3.2 Julia配置
(1)julia安装package
julia安装package有两种方法:
一种是通过Pkg.add()命令安装:在julia交互式环境输入以下命令:
using Pkg
Pkg.add("package_name")
另一种方法是针对1.0以上版本,在julia交互式环境下输入']'切换至Pkg操作界面,如下图:
通过add package_name
命令安装。
注意:由于julia服务器在国外,package安装时会由于网络不稳定出现失败,此时一个有效的解决办法是到本地存放package文件夹下找到安装失败的package手动删除后重新安装。window下默认的存放package的路径为:“C:\Users\用户名.julia\packages”。
关于julia的第三方包的详细信息可以通过https://juliaobserver.com/ 查询。
(2)julia配置
Julia 的 REPL(交互式编程环境) 扩展性很强,比较有名的比如 OhMyREPL,它可以提供代码高亮,代码补全等功能。可在REPL中通过以下命令安装和使用:
using Pkg
Pkg.add("OhMyREPL") //安装包
using OhMyREPL //调用包
以上命令为Julia安装和使用package的通用方法,后面不在赘述。
关于OhMyREPL的详细配置可以参考其官方文档:https://kristofferc.github.io/OhMyREPL.jl
(3)julia调用Python、R混合编程
Julia可以方便的调用Python和R,主要通过PyCall、RCall、Conda三个包来实现,详细操作可查看其文档说明。
注意:安装julia第三方包时,最好先查看其官方文档,确定适用版本后再安装使用。
4 关于IDE
目前,有很多IDE可同时搭建Python、R、Julia环境,如Vscode、Atom等,在此推荐Jupyter Lab,相比工程开发,其更适用于科学实验。
Jupyter源于Ipython Notebook,是使用Python(也有R、Julia、Node等其他语言的内核)进行代码演示、数据分析、可视化、教学的很好的工具,对Python的愈加流行和在AI领域的领导地位有很大的推动作用。
Jupyter Lab是Jupyter的一个拓展,提供了更好的用户体验,例如可以同时在一个浏览器页面打开编辑多个Notebook,Ipython console和terminal终端,并且支持预览和编辑更多种类的文件,如代码文件,Markdown文档,json,yml,csv,各种格式的图片,vega文件(一种使用json定义图表的语言)和geojson(用json表示地理对象),还可以使用Jupyter Lab连接Google Drive等云存储服务,极大得提升了生产力。
安装Anaconda后,会包括jupyter notebook和Ipython内核,接下来需要完成三个步骤即可:
(1)安装jupyter lab
pip install jupyterlab
(2)安装R kernel
#在R中运行如下代码,来安装依赖的R包
install.packages(c('repr', 'IRdisplay', 'evaluate', 'crayon', 'pbdZMQ', 'devtools', 'uuid', 'digest'))
devtools::install_github('IRkernel/IRkernel')
#在R中运行如下代码,使得R在jupyter中可以被探测到。
IRkernel::installspec(user = FALSE)
报错,可以尝试:
> devtools::install_github('IRkernel/IRkernel',force = TRUE)
> install.packages("digest")
> devtools::install_github('IRkernel/IRkernel',force = TRUE)
(3)安装Julia kernel
#在julia REPL中运行以下代码
using Pkg
Pkg.add("IJulia")
启动Jupyter Lab
在cmd下输入:jupyter lab
即可,界面如下图:

注意:windows下启动可能会出现错误,此时可能需将系统防火墙关闭。
以上即为本人在配置Julia、Python、R混合编程环境过程中的简单总结,如有问题,恳请指正。