随笔分类 - 十一月
摘要:import pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn.ensemble import RandomForestClassifierfrom sklea
阅读全文
摘要:import pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn.ensemble import RandomForestClassifierfrom sklea
阅读全文
摘要:import pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt# 提供文件的绝对路径file_path = r'D:\BP_R_Data.xlsx' # 请替换为实际路径# 尝试读取Excel文件try: df = pd
阅读全文
摘要:import numpy as npfrom sklearn import datasetsfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import train_test_split,
阅读全文
摘要:import numpy as npfrom sklearn import datasetsfrom sklearn.cluster import KMeansfrom sklearn.model_selection import train_test_split, cross_val_score,
阅读全文
摘要:iris = load_iris()X, y = iris.data, iris.targetscaler = StandardScaler().fit(X)X_scaled = scaler.transform(X)# 分割数据集为训练集和测试集X_train, X_test, y_train,
阅读全文
摘要:from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_split, cross_validatefrom sklearn.preprocessing import StandardSc
阅读全文
摘要:import numpy as npfrom sklearn import datasetsfrom sklearn.model_selection import train_test_split, StratifiedKFoldfrom sklearn.svm import SVCfrom skl
阅读全文
摘要:from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_split, cross_val_scorefrom sklearn.tree import DecisionTreeClassi
阅读全文
摘要:# 导入必要的库from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_split, cross_val_score, StratifiedKFoldfrom sklearn.linea
阅读全文
摘要:import pandas as pdimport numpy as npfrom sklearn.datasets import load_irisfrom sklearn.model_selection import cross_val_score, StratifiedKFoldfrom sk
阅读全文
摘要:mport csvimport jsonimport xml.etree.ElementTree as ETdef generate_exercises(num_exercises=5): """ 生成简单的加法算式 :param num_exercises: 要生成的算式数量 :return: 包
阅读全文
摘要:实验7 Spark初级编程实践 1.实验目的 (1)掌握使用Spark访问本地文件和HDFS文件的方法 (2)掌握Spark应用程序的编写、编译和运行方法 2.实验平台 (1)操作系统:Ubuntu18.04(或Ubuntu16.04); (2)Spark版本:2.4.0; (3)Hadoop版本:
阅读全文
摘要:实验6 熟悉Hive的基本操作 1.实验目的 (1)理解Hive作为数据仓库在Hadoop体系结构中的角色。 (2)熟练使用常用的HiveQL。 2.实验平台 操作系统:Ubuntu18.04(或Ubuntu16.04)。 Hadoop版本:3.1.3。 Hive版本:3.1.2。 JDK版本:1.
阅读全文
摘要:实验5 MapReduce初级编程实践 1.实验目的 (1)通过实验掌握基本的MapReduce编程方法; (2)掌握用MapReduce解决一些常见的数据处理问题,包括数据去重、数据排序和数据挖掘等。 2.实验平台 (1)操作系统:Linux(建议Ubuntu16.04或Ubuntu18.04)
阅读全文
摘要:实验4 NoSQL和关系数据库的操作比较 1.实验目的 (1)理解四种数据库(MySQL、HBase、Redis和MongoDB)的概念以及不同点; (2)熟练使用四种数据库操作常用的Shell命令; (3)熟悉四种数据库操作常用的Java API。 2.实验平台 (1)操作系统:Linux(建议U
阅读全文
摘要:实验3 熟悉常用的HBase操作 1.实验目的 (1)理解HBase在Hadoop体系结构中的角色; (2)熟练使用HBase操作常用的Shell命令; (3)熟悉HBase操作常用的Java API。 2.实验平台 (1)操作系统:Linux(建议Ubuntu16.04或Ubuntu18.04);
阅读全文
摘要:实验2 熟悉常用的HDFS操作 1.实验目的 (1)理解HDFS在Hadoop体系结构中的角色; (2)熟练使用HDFS操作常用的Shell命令; (3)熟悉HDFS操作常用的Java API。 2. 实验平台 (1)操作系统:Linux(建议Ubuntu16.04或Ubuntu18.04); (2
阅读全文
摘要:实验1 熟悉常用的Linux操作和Hadoop操作 1.实验目的 Hadoop运行在Linux系统上,因此,需要学习实践一些常用的Linux命令。本实验旨在熟悉常用的Linux操作和Hadoop操作,为顺利开展后续其他实验奠定基础。 2.实验平台 (1)操作系统:Linux(建议Ubuntu16.0
阅读全文