会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
HHello_World
博客园
首页
新随笔
联系
订阅
管理
2019年5月15日
莫烦Python之机器学习概念了解
摘要: 1、机器学习分类 有监督学习 无监督学习 半监督学习 强化学习 遗传算法 2、神经网络 一种基于传统统计学的模型,由大量的神经元与其关系构成。常用来对复杂的输入和输出关系进行建模 误差反向传递:给出信号,得到经过神经网络算法之后的结果(信号正向传播),再根据结果来修改神经网络中的神经元强度(信号反向
阅读全文
posted @ 2019-05-15 22:39 HHello_World
阅读(463)
评论(0)
推荐(0)
2019年5月12日
机器学习-学习笔记1
摘要: 什么是机器学习? 监督学习(supervised learning) 如神经网络,提供数据和数据的标签进行训练 非监督学习(Unsupervised learning) 只提供数据而不提供对应的标签进行训练 半监督学习 利用少量有标签样本和大量无标签样本进行训练,来对无标签样本进行分类 强化学习(r
阅读全文
posted @ 2019-05-12 16:17 HHello_World
阅读(146)
评论(0)
推荐(0)
2018年11月14日
docker的安装
摘要: 工作中会用到docker,于是这两天都在学习相关内容。 docker是一个开源的应用容器引擎,刚开始看到这个定义完全摸不清头脑。其实从头到尾走一遍流程就清晰了。镜像和容器的关系就像类与对象一样。容器依赖镜像创建,一个容器类似于一个虚拟机,在上面可以做各种操作,每个容器是相互隔绝的环境。 主要使用do
阅读全文
posted @ 2018-11-14 23:08 HHello_World
阅读(162)
评论(0)
推荐(0)
2017年12月4日
爬虫实例之selenium爬取淘宝美食
摘要: 这次的实例是使用selenium爬取淘宝美食关键字下的商品信息,然后存储到MongoDB。 首先我们需要声明一个browser用来操作,我的是chrome。这里的wait是在后面的判断元素是否出现时使用,第二个参数为等待最长时间,超过该值则抛出异常。 声明好之后就需要进行打开网页、进行搜索的操作。
阅读全文
posted @ 2017-12-04 11:37 HHello_World
阅读(2060)
评论(0)
推荐(0)
2017年11月29日
爬虫实例之爬取今日头条组图
摘要: 试了一下爬取今日头条的组图。 首先是进入输入关键词后的索引页,使用chrom的开发者工具可以看到这是一个get请求,且包含一些数据,于是在这一步应该构造这个get请求,请求成功则会返回一个json数据。 对于上一步返回的数据进行解析,取出需要的article_url字段 对每个组图的url进行请求:
阅读全文
posted @ 2017-11-29 21:25 HHello_World
阅读(2061)
评论(0)
推荐(0)
2017年10月17日
爬虫+词云:爬取豆瓣电影top100的导演制作图云
摘要: 前段时间做了一个关于豆瓣电影的爬虫,之后又写了一个陈奕迅歌词的词云制作,于是我想不如做一个关于豆瓣高分电影导演的词云试试,于是有了接下来这篇随笔。 首先,我需要知道豆瓣top100电影详情页面的url,以便爬取对应导演。在豆瓣电影top250界面 在得到top100电影详情界面的url之后,需要对这
阅读全文
posted @ 2017-10-17 16:57 HHello_World
阅读(1462)
评论(0)
推荐(0)
2017年10月14日
wordcloud实例之陈奕迅歌词
摘要: 一直想做一个词云,在看实例的时候发现了一位博主写了篇关于励志歌曲的词云,由此想分析一下陈奕迅歌词中出现的较高频率的词是什么。于是我在百度文库上找到了一部分歌词,做了这个小分析。需要用到的库有:wordcloud,jieba,PIL,numpy,matplotlib 首先是读取歌词文件 在此之后,需要
阅读全文
posted @ 2017-10-14 16:47 HHello_World
阅读(609)
评论(0)
推荐(0)
2017年10月12日
爬虫实例之豆瓣高分电影
摘要: 学了python这么久,终于写了一个小爬虫,虽然很简单,但是总算动手了。 这个爬虫小程序爬取了豆瓣高分榜前100的电影名,所用到的知识也十分简单。 以下是源码 之前学习了Python的基本数据结构,但是在用到时才发现学的比较零散,用的时候不知道该怎么用,还是需要更多的项目来练习。 在这个简单的项目中
阅读全文
posted @ 2017-10-12 19:51 HHello_World
阅读(617)
评论(0)
推荐(0)
2017年10月5日
Python学习笔记之正则表达式
摘要: 正则表达式:匹配文本片段的模式。 通配符:匹配多于一个的字符串。如‘.’可以匹配除换行符之外所有字符,只能匹配一个字符。 对特殊字符进行转义:假如要对字符串‘Python.org’进行匹配,如果直接使用‘python.org’进行匹配,则不仅会匹配到'python.org',还会有'pythonio
阅读全文
posted @ 2017-10-05 16:05 HHello_World
阅读(1636)
评论(0)
推荐(1)
2017年8月29日
Python学习笔记之文件和流
摘要: 打开文件:open(name[,mode[,buffering]]),返回一个文件对象,模式(mode)和缓冲(buffering)是两个可选参数。 假设有一个名为somefile.txt的文件,存储路径为c:\text,打开方式如下:f = open(r'C:\text\somefile.txt'
阅读全文
posted @ 2017-08-29 20:13 HHello_World
阅读(263)
评论(0)
推荐(0)
下一页
公告