上一页 1 2 3 4 5 6 7 8 ··· 12 下一页
摘要: '''爬取猫眼电影TOP100,并将其保存''' from urllib import request import re import csv import time import random import os class MaoyanSpider: def __init__(self): self.url = 'https://maoyan.com/board... 阅读全文
posted @ 2019-07-19 12:26 一如年少模样 阅读(317) 评论(0) 推荐(0) 编辑
摘要: ''' 聚类之均值漂移:首先假定样本空间中的每个聚类均服从某种已知的概率分布规则,然后用不同的概率密度函数拟合样本中的统计直方图, 不断移动密度函数的中心(均值)的位置,直到获得最佳拟合效果为止。这些概率密度函数的峰值点就是聚类的中心, 再根据每个样本距离各个中心的距离,选择最近聚类中心所属的类别作为该样本的类别。 ... 阅读全文
posted @ 2019-07-19 08:38 一如年少模样 阅读(5464) 评论(0) 推荐(0) 编辑
摘要: ''' 聚类:分类(class)与聚类(cluster)不同,分类是有监督学习模型,聚类属于无监督学习模型。 聚类讲究使用一些算法把样本划分为n个群落。一般情况下,这种算法都需要计算欧氏距离。(用两个样本对应特征值之差的平方和之平方根, 即欧氏距离,来表示这两个样本的相似性) 1.K均值算法: 第一步:随机选择k个... 阅读全文
posted @ 2019-07-19 07:11 一如年少模样 阅读(1618) 评论(0) 推荐(0) 编辑
摘要: ''' 案例:事件预测----加载event.txt,预测某个时间段是否会出现特殊事件。步骤如下: 1.数据预处理: 1>.读取文件,加载data数组,删除索引为1的列 2>.针对每一列做编码,离散数据使用LabelEncoder,连续的数字数据使用DigitEncoder(需要自定义),编码器需要保存 ... 阅读全文
posted @ 2019-07-17 20:34 一如年少模样 阅读(3815) 评论(0) 推荐(0) 编辑
摘要: ''' 超参数处理之网格搜素:获取一个最优超参数的方式可以绘制验证曲线,但是验证曲线只能每次获取一个最优超参数。 如果多个超参数有很多排列组合的话,就可以使用网格搜索寻求最优超参数组合。 针对超参数组合列表中的每一个超参数组合,实例化给定的模型,做cv次交叉验证, ... 阅读全文
posted @ 2019-07-17 18:52 一如年少模样 阅读(555) 评论(0) 推荐(0) 编辑
摘要: '''音乐播放排名''' import redis r = redis.Redis(host='127.0.0.1', port=6379, password='123456', db=0) r.zadd('ranking', {'song1': 1, 'song2': 1, 'song3': 1, 'song4': 1}) r.zadd('ranking', {'song5': 1, 'so.. 阅读全文
posted @ 2019-07-17 10:31 一如年少模样 阅读(368) 评论(0) 推荐(0) 编辑
摘要: 上图可见,该样本数据的样本类别区分度不好,选区的特征无法区分类别,遇到这种情况,通常要考虑增加样本特征,以提高类别区分度 阅读全文
posted @ 2019-07-17 08:31 一如年少模样 阅读(6166) 评论(0) 推荐(0) 编辑
摘要: '''微博共同关注''' import redis r = redis.Redis(host='127.0.0.1', port=6379, db=0, password=123456) # user_one 关注的人(放到集合中) r.sadd('user_one', 'xiaomi', 'xiaogou', 'xiaomao', 'xiaozhu', 'xiaoji') # user_... 阅读全文
posted @ 2019-07-16 16:42 一如年少模样 阅读(453) 评论(0) 推荐(0) 编辑
摘要: ''' 用户想要查询个人信息 1、到redis缓存中查询个人信息 2、redis中查询不到,到mysql查询,并缓存到redis 3、再次查询个人信息 ''' import redis import pymysql # 用户从终端输入要查询的用户:zhang username = input('请输入用户名:') # key field ... 阅读全文
posted @ 2019-07-16 15:29 一如年少模样 阅读(930) 评论(0) 推荐(0) 编辑
摘要: ''' 学习曲线:模型性能 = f(训练集大小) 学习曲线所需API: _, train_scores, test_scores = ms.learning_curve( model, # 模型 输入集, 输出集, ... 阅读全文
posted @ 2019-07-16 12:57 一如年少模样 阅读(2409) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 12 下一页