摘要:
写在前面的话:由于spark2.0.0之后ML中才包括LDA,GaussianMixture 模型,这里k-means用的是ML模块做测试,LDA,GaussianMixture 则用的是MLlib模块 数据资料下载网站,大力推荐!!! http://archive.ics.uci.edu/ml/d 阅读全文
摘要:
第一步:安装anaconda anaconda自带一系列科学计算包 下载链接:http://pan.baidu.com/s/1b4jWlg 密码:fqq3 接着配置环境变量:如我安装在D盘下 试一下命令行启动,确保ipython从anaconda启动 第二步:安装spark(需要提前安装JDK) 到 阅读全文
摘要:
修改目录与目录组: sudo chown -R hadoop:hadoop spark-1.6.1-bin-hadoop2.6 sudo chown -R hadoop:hadoop jdk1.8.0_101 sudo chown -R hadoop:hadoop scala2.11.6 1./et 阅读全文
摘要:
1.改变机器的名称: vim /etc/hostname Master 在文件中修改机器名称为我们想要的名称(相当于域名) 可以通过shutdown -h now 关闭 2.查看当前机器IP: ifconfig 3.vim /etc/hosts 127.0.0.1 localhost 建立ip与域名 阅读全文
摘要:
//某个人评分数据 //拆分训练集,校验集,测试集(ratings是(Int,Rating)格式,取values即可) 阅读全文
摘要:
1.sudo apt-get install openjdk-8-jre openjdk-8-jdk 2.默认会安装在 路径为 /usr/lib/jvm/java-7-openjdk-amd64 下面 3。配置环境变量 vim ~/.bashrc export JAVA_HOME = /usr/li 阅读全文