12 2018 档案

摘要:1. 读取数据集 2. 训练集与测试集划分 3. 线性回归模型:建立13个变量与房价之间的预测模型,并检测模型好坏。 阅读全文
posted @ 2018-12-26 23:06 澄枫一叶 阅读(142) 评论(0) 推荐(0) 编辑
摘要:text4.collocations() #最频繁出现的双连词#>>[len(w)for w in text1]>>>fdist =FreqDist([len(w)for w in text1])>>>fdist>>>fdist.keys()>>fdist.items()>>fdist.max()d 阅读全文
posted @ 2018-12-25 20:55 澄枫一叶 阅读(345) 评论(0) 推荐(0) 编辑
摘要:结果: 阅读全文
posted @ 2018-12-23 18:16 澄枫一叶 阅读(93) 评论(0) 推荐(0) 编辑
摘要:1. 导入boston房价数据集 2. 一元线性回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 3. 多元线性回归模型,建立13个变量与房价之间的预测模型,并检测模型好坏,并图形化显示检查结果。 4. 一元多项式回归模型,建立一个变量与房价之间的预测模型,并图形化显示。 from skl 阅读全文
posted @ 2018-12-10 11:32 澄枫一叶 阅读(126) 评论(0) 推荐(0) 编辑
摘要:1. 数据准备:收集数据与读取 2. 数据预处理:处理数据 3. 训练集与测试集:将先验数据按一定比例进行拆分。 4. 提取数据特征,将文本解析为词向量 。 5. 训练模型:建立模型,用训练数据训练模型。即根据训练样本集,计算词项出现的概率P(xi|y),后得到各类下词汇出现概率的向量 。 6. 测 阅读全文
posted @ 2018-12-03 11:37 澄枫一叶 阅读(302) 评论(0) 推荐(0) 编辑