小陆同学

python 中文名:蟒蛇,设计者:Guido van Rossum

导航

2019年6月19日 #

机器学习---那些不得不说的概念

摘要: 1、回归模型与分类模型有哪些相同点和异同点? 回归问题通常是用来预测一个值,是对真实值的一种逼近预测 分类问题是用于将事物打上一个标签,通常结果为离散值。分类并没有逼近的概念,最终正确结果只有一个,错误的就是错误的 相同点:都属于监督学习,都有特征和标签 2、pandas中loc iloc 区别? 阅读全文

posted @ 2019-06-19 20:04 小陆同学 阅读(225) 评论(0) 推荐(0) 编辑

csrf攻击与csrf防御

摘要: CSRF(Cross-site request forgery)跨站请求伪造,也被称为“One Click Attack”或者Session Riding,通常缩写为CSRF或者XSRF,是一种对网站的恶意利用。尽管听起来像跨站脚本(XSS),但它与XSS非常不同,XSS利用站点内的信任用户,而CS 阅读全文

posted @ 2019-06-19 19:39 小陆同学 阅读(173) 评论(0) 推荐(0) 编辑

2019年5月21日 #

将scrapy爬取数据通过django入到SQLite数据库

摘要: 1. 在django项目根目录位置创建scrapy项目,django_12是django项目,ABCkg是scrapy爬虫项目,app1是django的子应用 2.在Scrapy的settings.py中加入以下代码 3.编写爬虫,下面代码以ABCkg为例,abckg.py 4.scrapy中ite 阅读全文

posted @ 2019-05-21 19:11 小陆同学 阅读(1291) 评论(0) 推荐(0) 编辑

2019年5月20日 #

django--中运行scrapy框架

摘要: 1.新建一个django项目, 2.前端展示一个按钮 3.在django项目的根目录创建scrapy项目 4.cmd命令行运行:scrapyd 启动服务 5.将scrapy项目部署到当前工程:scrapyd-deploy 爬虫名称 -p 项目名称 6.views.py 7.在本地6800端口点击jo 阅读全文

posted @ 2019-05-20 17:22 小陆同学 阅读(3346) 评论(1) 推荐(1) 编辑

spider-通过scrapyd网页管理工具执行scrapy框架

摘要: 1.首先写一个scrapy框架爬虫的项目 2.部署环境 3.在爬虫项目目录下输入命令:scrapyd,已经在本地6800端口运行 4.在爬虫根目录执行:scrapyd-deploy,如果提示不是内部命令,需要到python目录下scripts下新建一个名为scrapyd-deploy.bat的文件, 阅读全文

posted @ 2019-05-20 11:31 小陆同学 阅读(1465) 评论(0) 推荐(1) 编辑

2019年5月7日 #

python--numpy生成正态分布数据及randint randn normal的使用

摘要: 正太分布:也叫(高斯分布Gaussian distribution),是一种随机概率分布 机器学习中numpy.random如何生成这样的正态分布数据,本篇博客记录这样的用法 import numpy as np# a = np.random.randint(1,10,size=2) # 最小值,最 阅读全文

posted @ 2019-05-07 19:17 小陆同学 阅读(14281) 评论(1) 推荐(2) 编辑

2019年5月5日 #

python-pandas读取mongodb、读取csv文件

摘要: 续上一篇博客(‘’selenium爬取NBA并将数据存储到MongoDB‘)https://www.cnblogs.com/lutt/p/10810581.html 本篇的内容是将存储到mongo的数据用pandas读取出来,存到CSV文件,然后pandas读取CSV文件。 其中mongo的操作涉及 阅读全文

posted @ 2019-05-05 00:28 小陆同学 阅读(2116) 评论(0) 推荐(0) 编辑

selenium爬取NBA并将数据存储到MongoDB

摘要: selenium:浏览器自动化测试框架 ,Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。 mongodb:是一个基于分布式文件存储的数据库。由C++语言编写。介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。 业务需求: 将某网站的数据用py 阅读全文

posted @ 2019-05-05 00:16 小陆同学 阅读(773) 评论(0) 推荐(0) 编辑

2019年5月3日 #

机器学习--matplotlib绘制各种图表

摘要: 机器学习三剑客:numpy、pandas、matplotlib NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵。 pandas 是基于numpy的一种工具,该工具是为了解决数据分析任务而创建的。 Matplotlib 是一个 Python 的 2D绘图库,它以 阅读全文

posted @ 2019-05-03 23:15 小陆同学 阅读(3459) 评论(0) 推荐(0) 编辑

2019年4月24日 #

django--orm对象关系映射之常用的增删改查

摘要: 1.查询表里所有数据 2.条件查询 3.排序 4.求数量 5.单独取某个字段 6.排除某些数据 7.修改 8.删除 阅读全文

posted @ 2019-04-24 19:57 小陆同学 阅读(299) 评论(0) 推荐(0) 编辑