摘要:
1.数据特征 探索数据的特征,查看每列属性、最大值、最小值是了解数据的第一步。查看数据特征, #查看数据特征 import numpy as np import pandas as pd inputfile='D:\\大三下\\大数据实验课\\data\\Unit8\\GoodsOrder.csv' 阅读全文
摘要:
问题1:ModuleNotFoundError: No module named ‘jieba‘问题解决方案 在Anaconda的Prompt (anaconda3)中输入 pip install jieba -i https://pypi.tuna.tsinghua.edu.cn/simple/ 阅读全文
摘要:
1.评论去重 # -*- coding: utf-8 -*- # 代码12-1 评论去重的代码 import pandas as pd import re import jieba.posseg as psg import numpy as np # 去重,去除完全重复的数据 reviews = p 阅读全文
摘要:
# -*- coding: utf-8 -*- # 代码11-1 import os import pandas as pd # 修改工作路径到指定文件夹 #os.chdir("D:/chapter11/demo") os.chdir("D:\\大三下\\大数据实验课\\data\\Unit11") 阅读全文
摘要:
当输入 from sklearn.externals import joblib 会出现如下错 需要把代码直接改为如下代码即可: import joblib 阅读全文
摘要:
1.探索分析热水器的水流量状况 # -*- coding: utf-8 -*- """ Created on Mon Mar 20 15:12:41 2023 @author: admin """ import pandas as pd import matplotlib.pyplot as plt 阅读全文
摘要:
#1.描述性统计分析 数据探索#对数据进行基本的探索#返回缺失值个数以及最大、最小值import pandas as pddatafile='D:\\大三下\\大数据实验课\\demo\\unit7\\air_data.csv'#航空原始数据,第一行为属性标签resultfile='D:\\大三下\ 阅读全文
摘要:
#描述性统计分析和相关系数矩阵import pandas as pd import numpy as np inputfile='D:\大三下\大数据实验课\demo\data.csv'#输入数据的文件 data=pd.read_csv(inputfile)#读取数据 description=[da 阅读全文
摘要:
import pandas as pd import numpy as np catering_sale='D:\大三下\大数据实验课\data\catering_sale.xls' data=pd.read_excel(catering_sale,names=['data','sale']) bi 阅读全文