摘要: 1.数据特征 探索数据的特征,查看每列属性、最大值、最小值是了解数据的第一步。查看数据特征, #查看数据特征 import numpy as np import pandas as pd inputfile='D:\\大三下\\大数据实验课\\data\\Unit8\\GoodsOrder.csv' 阅读全文
posted @ 2023-04-21 23:17 JUN子子 阅读(267) 评论(0) 推荐(0) 编辑
摘要: 问题1:ModuleNotFoundError: No module named ‘jieba‘问题解决方案 在Anaconda的Prompt (anaconda3)中输入 pip install jieba -i https://pypi.tuna.tsinghua.edu.cn/simple/ 阅读全文
posted @ 2023-04-04 15:55 JUN子子 阅读(321) 评论(0) 推荐(0) 编辑
摘要: 1.评论去重 # -*- coding: utf-8 -*- # 代码12-1 评论去重的代码 import pandas as pd import re import jieba.posseg as psg import numpy as np # 去重,去除完全重复的数据 reviews = p 阅读全文
posted @ 2023-04-04 15:27 JUN子子 阅读(88) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: utf-8 -*- # 代码11-1 import os import pandas as pd # 修改工作路径到指定文件夹 #os.chdir("D:/chapter11/demo") os.chdir("D:\\大三下\\大数据实验课\\data\\Unit11") 阅读全文
posted @ 2023-04-03 01:00 JUN子子 阅读(63) 评论(0) 推荐(0) 编辑
摘要: 当输入 from sklearn.externals import joblib 会出现如下错 需要把代码直接改为如下代码即可: import joblib 阅读全文
posted @ 2023-03-23 16:25 JUN子子 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 1.探索分析热水器的水流量状况 # -*- coding: utf-8 -*- """ Created on Mon Mar 20 15:12:41 2023 @author: admin """ import pandas as pd import matplotlib.pyplot as plt 阅读全文
posted @ 2023-03-23 16:13 JUN子子 阅读(65) 评论(0) 推荐(0) 编辑
摘要: #1.描述性统计分析 数据探索#对数据进行基本的探索#返回缺失值个数以及最大、最小值import pandas as pddatafile='D:\\大三下\\大数据实验课\\demo\\unit7\\air_data.csv'#航空原始数据,第一行为属性标签resultfile='D:\\大三下\ 阅读全文
posted @ 2023-03-13 21:38 JUN子子 阅读(72) 评论(0) 推荐(0) 编辑
摘要: #描述性统计分析和相关系数矩阵import pandas as pd import numpy as np inputfile='D:\大三下\大数据实验课\demo\data.csv'#输入数据的文件 data=pd.read_csv(inputfile)#读取数据 description=[da 阅读全文
posted @ 2023-03-05 21:47 JUN子子 阅读(63) 评论(0) 推荐(0) 编辑
摘要: import pandas as pd import numpy as np catering_sale='D:\大三下\大数据实验课\data\catering_sale.xls' data=pd.read_excel(catering_sale,names=['data','sale']) bi 阅读全文
posted @ 2023-02-25 21:12 JUN子子 阅读(78) 评论(0) 推荐(0) 编辑
摘要: 模拟乒乓球 阅读全文
posted @ 2021-11-14 11:08 JUN子子 阅读(25) 评论(0) 推荐(0) 编辑