06 2022 档案

摘要:pandas所有方法学习 https://cankaoshouce.com/pandas-dataframes/pandas-ref-dataframe.html 阅读全文
posted @ 2022-06-30 11:46 半个程序猿Cohen_Lee 阅读(122) 评论(0) 推荐(0) 编辑
摘要:引用链接https://www.jianshu.com/p/80c98ae72db2 在pyspark中的vector有两种类型,一种是DenseVector,其与一般的列表或者array数组形式非常相似;另一种则是SparseVector,这种vector在保存数据的时候保存三个信息:向量长度,向 阅读全文
posted @ 2022-06-30 11:06 半个程序猿Cohen_Lee 阅读(290) 评论(0) 推荐(0) 编辑
摘要:在命令行上创建新的存储库 echo "# EY_general_python_item" >> README.md git init git add README.md git commit -m "first commit" git branch -M main git remote add or 阅读全文
posted @ 2022-06-30 11:02 半个程序猿Cohen_Lee 阅读(26) 评论(0) 推荐(0) 编辑
摘要:##Hadoop ###集群开启命令 start-all.sh mapred --daemon start historyserver ##hive 启动beeline模式:./beeline -u jdbc:hive2://node1:10000 -n atguigu 启动hiveservice2 阅读全文
posted @ 2022-06-21 10:26 半个程序猿Cohen_Lee 阅读(25) 评论(0) 推荐(0) 编辑
摘要:Spark #安装Anaconda3 一、 上传 Anaconda3-2021.05-Linux-x86_64.sh 到 /export/server/ 二、 安装Anaconda3-2021.05-Linux-x86_64.sh sh Anaconda3-2021.05-Linux-x86_64. 阅读全文
posted @ 2022-06-06 14:53 半个程序猿Cohen_Lee 阅读(122) 评论(0) 推荐(0) 编辑
摘要:大数据导论 ##企业大数据分析方向 数据是什么 数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号 或这些物理符号的组合,它是可识别的、抽象的符号。 ###数据分析 把隐藏在数据背后的信息集中和提炼出来,总结出所研究对象的内在规律,帮助管理者进行有效 阅读全文
posted @ 2022-06-01 17:06 半个程序猿Cohen_Lee 阅读(80) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示