上一页 1 2 3 4 5 6 7 ··· 12 下一页
摘要: ''' 图像识别: OpenCV基础:OpenCV是一个开源的计算机视觉库。提供了很多图像处理常用的工具。 图像的本质是三维数组 ''' import cv2 as cv import numpy as np # 读取图片 img = cv.imread('./ml_data/forest.jpg' 阅读全文
posted @ 2019-07-25 07:57 一如年少模样 阅读(293) 评论(0) 推荐(0) 编辑
摘要: ''' 语音识别:声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。 通过傅里叶变换,可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布, 建立音频内容和文本的对应关系,以此作为模型训练的基础。 梅尔频率倒谱系数(MFCC)通过与声音内... 阅读全文
posted @ 2019-07-24 22:16 一如年少模样 阅读(416) 评论(0) 推荐(0) 编辑
摘要: # 模拟业务场景 reviews = [ 'It is an amazing movie.', 'This is a dull movie. I would never recommend it to anyone.', 'The cinematography is pretty great in this movie.', 'The direction was ... 阅读全文
posted @ 2019-07-24 19:58 一如年少模样 阅读(1072) 评论(0) 推荐(0) 编辑
摘要: ''' 自然语言处理(NLP) 词袋模型:一句话的语义很大程度取决于某个单词出现的次数,所以可以把句子中所有可能出现的单词作为特征名, 每一个句子为一个样本,单词在句子中出现的次数为特征值构建数学模型,称为词袋模型。 例如: 1 The ... 阅读全文
posted @ 2019-07-24 08:11 一如年少模样 阅读(3761) 评论(0) 推荐(0) 编辑
摘要: ''' 推荐引擎 (用户画像):把最需要的推荐给用户。 在不同的机器学习场景中通常需要分析相似样本。而统计相似样本的方式可以基于欧氏距离分数,也可基于皮氏距离分数。 欧氏距离分数 : 欧氏距离分数 = 1/(1+欧式距离) ----计算所得欧氏距离分数区间处于:... 阅读全文
posted @ 2019-07-23 08:39 一如年少模样 阅读(856) 评论(0) 推荐(0) 编辑
摘要: 猫眼电影网站页面布局整体采用静态页面,其TOP100榜单按照评分和评分人数从高到低综合排序取前100名,如下: 那么,如何爬取电影库中的经典电影呢?为此,本人特意对经典电影库进行了爬取,具体遇到的困难及解决的办法如下: 1、爬取内容:本次爬取维度有电影名称、电影类型、电影制片国家、电影时长/分钟、上 阅读全文
posted @ 2019-07-23 08:28 一如年少模样 阅读(699) 评论(0) 推荐(0) 编辑
摘要: ''' DBSCAN算法:从样本空间中任意选择一个样本,以事先给定的半径做圆,凡被该圆圈中的样本都视为与该样本处于相同的聚类, 以这些被圈中的样本为圆心继续做圆,重复以上过程,不断扩大被圈中样本的规模,直到再也没有新的样本加入为止, 至此即得到一个聚类。于剩余样本中,重复以上过程,直到耗尽样本空间中的所有样本为止。 DBS... 阅读全文
posted @ 2019-07-21 11:32 一如年少模样 阅读(5123) 评论(1) 推荐(0) 编辑
摘要: ''' 轮廓系数:-----聚类的评估指标 好的聚类:内密外疏,同一个聚类内部的样本要足够密集,不同聚类之间样本要足够疏远。 轮廓系数计算规则:针对样本空间中的一个特定样本,计算它与所在聚类其它样本的平均距离a, 以及该样本与距离最近的另一个聚类中所有样本的平均距离b,该样本的轮廓系数为(b-a)/max(a, b... 阅读全文
posted @ 2019-07-21 09:13 一如年少模样 阅读(15957) 评论(0) 推荐(2) 编辑
摘要: ''' 凝聚层次算法:首先假定每个样本都是一个独立的聚类,如果统计出来的聚类数大于期望的聚类数,则从每个样本出发寻找离自己最近的另一个样本, 与之聚集,形成更大的聚类,同时令总聚类数减少,不断重复以上过程,直到统计出来的聚类数达到期望值为止。 凝聚层次算法的特点: 1.聚类数k必须事先已知。借助某些... 阅读全文
posted @ 2019-07-21 08:56 一如年少模样 阅读(4883) 评论(0) 推荐(0) 编辑
摘要: '''二级静态页面的爬取''' from urllib import request import re import time import random import pymysql class DianyingtiantangSpider: def __init__(self): self.url = 'https://www.dytt8.net/html/gn... 阅读全文
posted @ 2019-07-19 17:02 一如年少模样 阅读(618) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 12 下一页