摘要:
#多元线性回归模型from sklearn.datasets import load_boston#波士顿房价数据集data = load_boston() from sklearn.model_selection import train_test_split x_train,x_test,y_train,y_test = train_test_split(data.data,data.... 阅读全文
摘要:
from sklearn import datasets # 波士顿房价数据集 data = datasets.load_boston() import pandas as pd # 转为DataFrame dataDF = pd.DataFrame(data.data,columns=data.feature_names) dataDF # 数据可视化操作和人为的一元线性拟合 import... 阅读全文
摘要:
import csv # 读数据 file_path = r'data\EmailData.txt' EmailData = open(file_path,'r',encoding='utf-8') Email_data = [] Email_target = [] csv_reader = csv.reader(EmailData,delimiter='\t') # 将数据分别存入数据列表和目... 阅读全文
摘要:
1.使用朴素贝叶斯模型对iris数据集进行花分类 尝试使用3种不同类型的朴素贝叶斯: from sklearn.datasets import load_iris iris=load_iris() from sklearn.naive_bayes import GaussianNB #高斯分布型 gnb=GaussianNB() #构造 pred=gnb.fit(iris.data,... 阅读全文
摘要:
from sklearn import datasets iris=datasets.load_iris() #导入的数据是一种字典形式,特征存储在iris.data中,标签存储在iris.target中 from sklearn.datasets import load_iris #从sklearn包datasets模块导入 load_iris iris=load_iris() at... 阅读全文
摘要:
#1.理解分类与监督学习、聚类与无监督学习。 #简述分类与聚类的联系与区别。 #分类:给数据“贴标签”,提高认知效率,降低认知成本,对于分类来说,在对数据集分类时,我们是知道这个数据集是有多少种类的 #聚类:聚类是将数据对象的集合分成相似的对象类的过程。使得同一个簇(或类)中的对象之间具有较高的相似性,而不同簇中的对象具有较高的相异性 #简述什么是监督学... 阅读全文
摘要:
from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np import matplotlib.image as img #image类可以用来读或存图片 china = load_sam... 阅读全文
摘要:
from sklearn.datasets import load_iris iris=load_iris() print(iris.DESCR)#显示数据集的相关描述 data=iris.data plt.plot(data[:,0],data[:,1],".")#将第一列萼片长度作为x坐标值,第二列萼片宽度作为y坐标值 plt.show() 阅读全文
摘要:
import matplotlib.pyplot as plt import numpy as np from sklearn.datasets import load_iris iris=load_iris() X=iris.data print(X) from sklearn.cluster import KMeans est=KMeans(n_clusters=3) est.fit(... 阅读全文
摘要:
1.用python实现K均值算法import numpy as np x=np.random.randint(1,100,[20,1]) y=np.zeros(20) k=3 def initcenter(x,k): return x[:k] kc=initcenter(x,k) kc def nearest(kc,i): d=(abs(kc-i)) w=... 阅读全文