上一页 1 2 3 4 5 6 7 8 9 ··· 23 下一页
摘要: Project 2010中的项目进度管理:将下图中的项目在Project 2010中实现 项目的开始时间为2020年4月20日,并用甘特图和关键路径方式显示,产生如下所示的结果 任务工作表: 甘特图: 网络图: 阅读全文
posted @ 2022-04-16 14:47 鯨落 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 使用tensorflow出现的错误: AttributeError: module ‘tensorflow‘ has no attribute ‘placeholder‘ 解决方法: 将代码: import tensorflow as tf 替换为 import tensorflow.compat. 阅读全文
posted @ 2022-04-15 15:24 鯨落 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 一共100个数据,下面的数据没截图,对count列和sum_列做归一化 首先查出count列和sum_ 列的最大值,最小值 再用sql语句:(表名为t1) create table t_count as select (count - count最小值)/ (count最大值-count最小值) f 阅读全文
posted @ 2022-04-01 15:26 鯨落 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 出现的错误提示: Exception in thread "main" joptsimple.UnrecognizedOptionException: zookeeper is not a recognized option 解决办法: 使用 bin/kafka-topics.sh --create 阅读全文
posted @ 2022-03-17 10:44 鯨落 阅读(1398) 评论(0) 推荐(0) 编辑
摘要: 1.sudo vim /etc/profile sudo进入profile文件 2. export JAVA_HOME=/usr/lib/jvm/jdk-1.8.0_212export HADOOP_HOME=usr/local/hadoopexport PATH=.:$HADOOP_HOME/bi 阅读全文
posted @ 2022-03-01 11:02 鯨落 阅读(2402) 评论(0) 推荐(0) 编辑
摘要: Spark遵循主从架构。 它的集群由一个主服务器和多个从服务器组成。 Spark架构依赖于两个抽象: (1)弹性分布式数据集(RDD) (2)有向无环图(DAG) 弹性分布式数据集 弹性分布式数据集是可以存储在工作节点上的内存中的数据项组。 (1)弹性:失败时恢复数据。 (2)分布式:数据分布在不同 阅读全文
posted @ 2022-02-10 22:41 鯨落 阅读(54) 评论(0) 推荐(0) 编辑
摘要: 今天装spark环境 阅读全文
posted @ 2022-01-03 20:20 鯨落 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 一,加分项 以下均为主观认为可以让老师加分的项: 1.这学期确定了自己的选择:在工作和考研中选择了考研,这个选择也是在各种亲戚,朋友,学长学姐的经历和劝说下选择的。寒假开始准备 2.参加问卷调查和合影,我一直比较内向的,见人能不说话就不说话,更不好意思跟陌生人开口,更不用说合影。这次花了5天做了34 阅读全文
posted @ 2021-12-19 22:25 鯨落 阅读(49) 评论(0) 推荐(0) 编辑
摘要: 8.数据分析 8.1 why 想要探索影响票房的因素,从电影市场趋势,观众喜好类型,电影导演,发行时间,评分与 关键词等维度着手,给从业者提供合适的建议。 8.2 what 8.2.1 电影类型:定义一个集合,获取所有的电影类型 genre = set() for i in df['genres'] 阅读全文
posted @ 2021-12-16 20:27 鯨落 阅读(108) 评论(0) 推荐(0) 编辑
摘要: 4 日期值处理 将 release_date 列转换为日期类型 5 筛选数据 票房、预算、受欢迎程度、评分为0的数据应该去除 评分人数过低的电影,评分不具有统计意义,筛选评分人数大于50的数据 6 json 数据转换 **说明:**genres,keywords,production_compani 阅读全文
posted @ 2021-12-14 21:27 鯨落 阅读(99) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 23 下一页