摘要:
一、boston房价预测 1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 4. 多项式回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 5. 比较线性模型与非线性模型的性能,并说明原因。 二、中文文本分类 按学号未位 阅读全文
摘要:
1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 4. 一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 阅读全文
摘要:
朴素贝叶斯应用:垃圾邮件分类 1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词 阅读全文
摘要:
分类与监督学习,朴素贝叶斯分类算法 简述分类与聚类的联系与区别。 2. 简述什么是监督学习与无监督学习。 朴素贝叶斯分类算法实例 利用关于心脏情患者的临床数据集,建立朴素贝叶斯分类模型。 有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数 目标分类变量疾病:–心梗–不稳定性 阅读全文
摘要:
from sklearn.datasets import load_sample_image import matplotlib.pyplot as plt from sklearn.cluster import KMeans import numpy as np flower=load_sample_image('flower.jpg')#原始图片 plt.imshow(flower) plt... 阅读全文
摘要:
import numpy as np x = np.random.randint(1, 100, 20) # 产生的20个一到一百的随机整数 y = np.zeros(20) k = 3 print(x) print(y) def initcenter(x, k): # 初始化聚类中心数组 return x[0:k].reshape(k) kc = initcenter(x, k... 阅读全文
摘要:
第五次作业 一、处理日期时间 第五次作业 一、处理日期时间 取系统时间 转换成‘2017年9月30日星期六10时28分56秒’格式字符串 ’2018-10-25 22:00‘转换成一个日期时间变量 计算两者的间隔 二、问题: 数列: a = a1,a2,a3,·····,an b = b1,b2,b 阅读全文
摘要:
一、处理日期时间 取系统时间 转换成‘2017年9月30日星期六10时28分56秒’格式字符串 ’2018-10-25 22:00‘转换成一个日期时间变量 计算两者的间隔 二、问题: 数列: a = a1,a2,a3,·····,an b = b1,b2,b3,·····,bn 求: c = a12 阅读全文
摘要:
q = open('遇见.txt', 'r', encoding='utf-8').read() wordsls = jieba.lcut(q) wcdict = {} for word in wordsls: if len(word) == 1: continue else: wcdict[word] = wcdict.get(word, 0) ... 阅读全文
摘要:
列表,元组,字典,集合的遍历: 1.练习: 总结列表,元组,字典,集合的联系与区别。 列表,元组,字典,集合的遍历。 2.英文词频统计: 下载一首英文的歌词或文章str 分隔出一个一个的单词 list 统计每个单词出现的次数 dict 阅读全文