R语言做文本挖掘 Part1安装依赖包
Part1 安装依赖包
【发现有人转载,决定把格式什么重新整理一遍,有时间做个进阶版文本挖掘,恩!原文地址:CSDN-R语言做文本挖掘 Part1安装依赖包】
R语言中中文分析的软件包是Rwordseg,Rwordseg软件包依赖rJava包,rJava需要本机中有安装Java。
第一步是安装Java,请安装JDK,JRE不行。请对应机型,下载安装32位的JDK。机器里已经有JDK的也请改成32位的,不然没办法使用Rwordseg,尝试使用过64位的,不可行。
下载地址:
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
查看JAVA是否安装成功,运行cmd,输入java –version,如果能正常显示你的Java版本则安装正确。如下图:
第二步是安装rJava,这个直接在R或者RStudio里面安装软件包就行了。如果是刚安装完java记得重启你的R或者RStudio。
重点:一般在安装R的时候可以选择32位或者64位的,尽量都安装,运行Ri386 3.1.2。如果是你用的是RStudio,请设置为32位,设置方法,工具栏Tools > Global Options > General,R version,改成32-bit。
直接输入命令安装:Install.packages(“rJava”);或者在操作界面直接选择安装程序包,在CRAN上选择rJava安装。
安装完后需要添加下面环境变量配置在Path下(感觉路径配置没起作用,可以不配):
%JAVA_HOME%\jre\bin\client;
%JAVA_HOME%\jre\bin\server;
E:\programFiles\R\R-3.1.2\library\rJava\jri
加载rJava包,library(“rJava”),没提示错误则rJava安装成功。
R的下载地址:http://cran.rstudio.com/
RStudio的下载地址:http://www.rstudio.com/products/rstudio/#Desk
第三步是安装Rwordseg。
Rwordseg项目目前发布在R-forge上,所以不能直接在R或者Rstudio中用安装软件包功能。网上有说(参考http://jliblog.com/app/rwordseg):
在最新版本的R下可以直接安装:
install.packages("Rwordseg", repos = "http://R-Forge.R-project.org")
如果是旧版本的R,可以通过source的方式进行安装:
install.packages("Rwordseg", repos = "http://R-Forge.R-project.org", type = "source")
下载地址: http://R-Forge.R-project.org/bin/windows/contrib/3.0/Rwordseg_0.2-1.zip但是这样安装不成功。后来尝试把软件包下载到本地后,从本地安装,可行。
下载完成后,在R或者RStudio中选择从本地zip文件安装软件包。安装完成后,加载程序包library(“Rwordseg”)。尝试使用Rwordseg,如下一个简单的例子:
library(Rwordseg)
segmentCN(c("生命在于运动", "生活处处皆风景"))
[[1]]
[1] "生命" "在于" "运动"
[[2]]
[1] "生活" "处处" "皆" "风景"
另外,该R包的中文文档下载地址: http://download.csdn.net/detail/cl1143015961/8436741
该文档中很详细地说明了软件包的功能,包括如何做分词,如何添加删除词语,如何添加删除字典,它支持的字典除了.dic格式之外,还有.scel(搜狗输入法的词库)。搜狗输入法的词库下载地址http://pinyin.sogou.com/dict/,选择你自己需要的分类去做尝试吧!
有问题欢迎指正,转载请注明来源,谢谢!
————————————————
版权声明:本文为CSDN博主「EchoCaiCai」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/cl1143015961/article/details/44082731
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南