06 2018 档案

摘要:``` mvn \ deploy:deploy-file \ -DgroupId=com.weibo.datasys \ -DartifactId=data-flow \ -Dversion=2.0.0 \ -Dpackaging=jar \ -Dfile=./target/data-flow-2.0.0-SNAPSHOT.jar \ -DgeneratePom=true \ -Durl=http... 阅读全文
posted @ 2018-06-27 19:35 澄轶 阅读(693) 评论(0) 推荐(0) 编辑
摘要:spark.yarn.jars spark.yarn.archive 配置错误可能会导致此问题 阅读全文
posted @ 2018-06-21 12:14 澄轶 阅读(5263) 评论(0) 推荐(0) 编辑
摘要:"Worked Reference" "Reference" 大家一定遇到过在使用Git时,不小心将一个很大的文件添加到库中,即使删除,记录中还是保存了这个文件。以后不管是拷贝,还是push/pull都比较麻烦。 === 删除大文件方法 方法很简单,就是先找到大文件对象再删除。 先清理当前worki 阅读全文
posted @ 2018-06-21 10:58 澄轶 阅读(3088) 评论(0) 推荐(0) 编辑
摘要:一般是手动编译python时,编译的机器上环境不全面导致的依赖库不完整。 需要安装bzip库,使用如下命令: 随后重新编译python即可。 若不想重新编译python,在centos下可以: python_install_path 通常是/usr/local/lib/python2.7/,如果py 阅读全文
posted @ 2018-06-19 14:36 澄轶 阅读(615) 评论(0) 推荐(0) 编辑
摘要:余弦相似度计算: 阅读全文
posted @ 2018-06-01 12:26 澄轶 阅读(2440) 评论(0) 推荐(0) 编辑
摘要:余弦相似度计算: 1 ```math 2 \cos(\bf{v_1}, \bf{v_2}) = \frac{\left( 3 v_1 \times v_2 \right)}{||v_1|| * ||v_2|| } 4 5 ``` ​ 阅读全文
posted @ 2018-06-01 12:20 澄轶 阅读(6726) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示