摘要: 一、boston房价预测 二、中文文本分类 阅读全文
posted @ 2018-12-21 10:41 Peace* 阅读(373) 评论(0) 推荐(0) 编辑
摘要: import os import numpy as np import sys from datetime import datetime import gc path = 'F:\\jj147' # 导入结巴库,并将需要用到的词库加进字典 import jieba # 导入停用词: with open(r'F:\stopsCN.txt', encoding='utf-8') as f: ... 阅读全文
posted @ 2018-12-20 23:53 Peace* 阅读(111) 评论(0) 推荐(0) 编辑
摘要: from sklearn.datasets import load_boston #导入Boston房价数据集 boston = load_boston() #读取数据集 # boston.keys() #查看key值 x = boston.data y = boston.target #训练集与测试集划分 from sklearn.cross_validation import ... 阅读全文
posted @ 2018-12-20 09:54 Peace* 阅读(427) 评论(0) 推荐(0) 编辑
摘要: from sklearn.datasets import load_boston #导入Boston房价数据集 boston = load_boston() #读取数据集 # boston.keys() #查看key值 x = boston.data y = boston.target #训练集与测试集划分 from sklearn.cross_validation import ... 阅读全文
posted @ 2018-12-20 09:47 Peace* 阅读(103) 评论(0) 推荐(0) 编辑
摘要: #1. 导入boston房价数据集 from sklearn.datasets import load_boston boston=load_boston() boston.keys() boston.feature_names import pandas as pd df=pd.DataFrame(boston.data) df #2. 一元线性回归模型,建立一个变量与房价之... 阅读全文
posted @ 2018-12-08 22:21 Peace* 阅读(96) 评论(0) 推荐(0) 编辑
摘要: 2.使用sklearn.model_selection.cross_val_score(),对模型进行验证: 3. 垃圾邮件分类 阅读全文
posted @ 2018-11-28 21:18 Peace* 阅读(213) 评论(0) 推荐(0) 编辑
摘要: 一、理解分类与监督学习、聚类与无监督学习。 1、简述分类与聚类的联系与区别。 分类就是按照某种标准给对象贴标签(label),再根据标签来区分归类。聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。区别是,分类是事先定义好类别 ,类别数不变 。分类器需要由人工标注的分类训练 阅读全文
posted @ 2018-11-18 21:38 Peace* 阅读(148) 评论(0) 推荐(0) 编辑
摘要: ​from sklearn.datasets import load_sample_image from sklearn.cluster import KMeans import matplotlib.pyplot as plt import numpy as np china=load_sample_image("china.jpg") plt.imshow(china) plt.show()... 阅读全文
posted @ 2018-11-05 00:04 Peace* 阅读(104) 评论(0) 推荐(0) 编辑
摘要: #用python实现K均值算法 import numpy as np x = np.random.randint(1,50,[20,1]) y = np.zeros(20) k = 3 #(1) 选取数据空间中的K个对象作为初始中心,每个对象代表一个聚类中心; def initcen(x,k): return x[:k] #(2) 对于样本中的数据对象,根据它们与这些聚类中心的欧氏距离,... 阅读全文
posted @ 2018-10-31 17:30 Peace* 阅读(245) 评论(0) 推荐(0) 编辑
摘要: #计算鸢尾花的花瓣长度的最大值,平均值,中值,均方差 import numpy as np from sklearn.datasets import load_iris data=load_iris() petal_length = data.data[:,2] print(petal_length) print("最大值",np.max(petal_length)) print("平均值",n... 阅读全文
posted @ 2018-10-22 15:47 Peace* 阅读(156) 评论(0) 推荐(0) 编辑