鯨落 - 博客园

2022年4月16日

2022.4.16

摘要： Project 2010中的项目进度管理：将下图中的项目在Project 2010中实现项目的开始时间为2020年4月20日，并用甘特图和关键路径方式显示，产生如下所示的结果任务工作表：甘特图：网络图：阅读全文

posted @ 2022-04-16 14:47 鯨落阅读(24) 评论(0) 推荐(0)

2022年4月15日

2022.4.15

摘要：使用tensorflow出现的错误： AttributeError: module ‘tensorflow‘ has no attribute ‘placeholder‘ 解决方法：将代码： import tensorflow as tf 替换为 import tensorflow.compat. 阅读全文

posted @ 2022-04-15 15:24 鯨落阅读(50) 评论(0) 推荐(0)

2022年4月1日

数据归一化

摘要：一共100个数据，下面的数据没截图，对count列和sum_列做归一化首先查出count列和sum_ 列的最大值，最小值再用sql语句：(表名为t1） create table t_count as select (count - count最小值）/ (count最大值-count最小值) f 阅读全文

posted @ 2022-04-01 15:26 鯨落阅读(128) 评论(0) 推荐(0)

2022年3月17日

解决Kafka的一点小问题

摘要：出现的错误提示： Exception in thread "main" joptsimple.UnrecognizedOptionException: zookeeper is not a recognized option 解决办法：使用 bin/kafka-topics.sh --create 阅读全文

posted @ 2022-03-17 10:44 鯨落阅读(1653) 评论(0) 推荐(0)

2022年3月1日

HDFS操作hadoop显示：未找到命令

摘要： 1.sudo vim /etc/profile sudo进入profile文件 2. export JAVA_HOME=/usr/lib/jvm/jdk-1.8.0_212export HADOOP_HOME=usr/local/hadoopexport PATH=.:$HADOOP_HOME/bi 阅读全文

posted @ 2022-03-01 11:02 鯨落阅读(3327) 评论(0) 推荐(0)

2022年2月10日

spark架构

摘要： Spark遵循主从架构。它的集群由一个主服务器和多个从服务器组成。 Spark架构依赖于两个抽象：（1）弹性分布式数据集(RDD) （2）有向无环图(DAG) 弹性分布式数据集弹性分布式数据集是可以存储在工作节点上的内存中的数据项组。（1）弹性：失败时恢复数据。（2）分布式：数据分布在不同阅读全文

posted @ 2022-02-10 22:41 鯨落阅读(76) 评论(0) 推荐(0)

2022年1月3日

2022.1.3

摘要：今天装spark环境阅读全文

posted @ 2022-01-03 20:20 鯨落阅读(19) 评论(0) 推荐(0)

2021年12月19日

2021下学期加分项，建议和总结

摘要：一，加分项以下均为主观认为可以让老师加分的项： 1.这学期确定了自己的选择：在工作和考研中选择了考研，这个选择也是在各种亲戚，朋友，学长学姐的经历和劝说下选择的。寒假开始准备 2.参加问卷调查和合影，我一直比较内向的，见人能不说话就不说话，更不好意思跟陌生人开口，更不用说合影。这次花了5天做了34 阅读全文

posted @ 2021-12-19 22:25 鯨落阅读(74) 评论(0) 推荐(0)

2021年12月16日

观影大数据分析（3）

摘要： 8.数据分析 8.1 why 想要探索影响票房的因素，从电影市场趋势，观众喜好类型，电影导演，发行时间，评分与关键词等维度着手，给从业者提供合适的建议。 8.2 what 8.2.1 电影类型：定义一个集合，获取所有的电影类型 genre = set() for i in df['genres'] 阅读全文

posted @ 2021-12-16 20:27 鯨落阅读(146) 评论(0) 推荐(0)

2021年12月14日

观影大数据分析（2）

摘要： 4 日期值处理将 release_date 列转换为日期类型 5 筛选数据票房、预算、受欢迎程度、评分为0的数据应该去除评分人数过低的电影，评分不具有统计意义，筛选评分人数大于50的数据 6 json 数据转换 **说明：**genres,keywords,production_compani 阅读全文

posted @ 2021-12-14 21:27 鯨落阅读(116) 评论(0) 推荐(0)

公告