摘要: Logistic回归模型 Logistich回归模型也被成为广义线性回归模型。 它是将线性回归模型的预测值经过非线性的Logit函数转换为[0,1]之间的概率值。 研究得是分类问题,跟之前的线性回归、岭回归、Lasso回归不同。 混淆矩阵 实际值 预 0 1 测 0 A B A+B 值 1 C D 阅读全文
posted @ 2020-10-30 01:47 最冷不过冬夜 阅读(1706) 评论(0) 推荐(0) 编辑
摘要: 线性回归模型的短板 当自变量个数多于样本量或自变量间存在多重共线性时,将无法根据公式计算回归系数的估计值。 岭回归模型 为了解决多元线性模型中回归参数β存在的不可逆问题,统计学家提出了岭回归模型。 该模型解决问题的思路是在线性模型的目标函数之上添加L2正则项(也称为惩罚项)。 λ值的确定--交叉验证 阅读全文
posted @ 2020-10-28 00:52 最冷不过冬夜 阅读(974) 评论(0) 推荐(0) 编辑
摘要: ⼀元线性回归模型 两边变量之间存在明显的线性关系 相关系数算法 # 方式1:用数学公式计算 import numpy import pandas X = [52,19,7,33,2] Y = [162,61,22,100,6] #公式计算 #均值 XMean = numpy.mean(X) YMea 阅读全文
posted @ 2020-10-27 22:57 最冷不过冬夜 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 数据准备 from pymongo import MongoClient import datetime client=MongoClient('mongodb://root:123@localhost:27017') table=client['db1']['emp'] # table.drop( 阅读全文
posted @ 2020-09-30 00:57 最冷不过冬夜 阅读(221) 评论(0) 推荐(0) 编辑
摘要: python代码操作mongoDB数据库 pip3 install pymongo # 模块下载 """ 常用软件的默认端口号 MySQL:3306 MongoDB:27017 了解 redis:6379 Django:8000 Tomcat:8080 Flask:5000 """ from pym 阅读全文
posted @ 2020-09-29 23:32 最冷不过冬夜 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 爬虫数据存储相关的数据库MongoDB 关系型数据库 MySQL、oracle、acess、db2、postgresql、sqlite... 1.存储数据基本都是以表格为基本形式 2.表与表之间可以建立关系(外键) 非关系型数据库 redis、mongodb、memcache 1.数据基本都是以ke 阅读全文
posted @ 2020-09-28 18:59 最冷不过冬夜 阅读(246) 评论(0) 推荐(0) 编辑
摘要: ###如何将爬取的数据直接导入excel表格 # 如何通过python代码操作excel表格 # 前戏 import requests import time from openpyxl import Workbook from bs4 import BeautifulSoup wb = Workb 阅读全文
posted @ 2020-09-27 20:38 最冷不过冬夜 阅读(229) 评论(0) 推荐(0) 编辑
摘要: # 参考网站:https://www.w3school.com.cn/xpath/xpath_syntax.asp doc=''' <html> <head> <base href='http://example.com/' /> <title>Example website</title> </h 阅读全文
posted @ 2020-09-27 20:35 最冷不过冬夜 阅读(141) 评论(0) 推荐(0) 编辑
摘要: import requests # 模拟请求模块 from bs4 import BeautifulSoup # 格式化模块 import re # 正则模块 import time # 时间模块 # 创建一个空白文档 with open('D:\豆瓣.text',mode='w',encoding 阅读全文
posted @ 2020-09-23 17:33 最冷不过冬夜 阅读(131) 评论(0) 推荐(0) 编辑
摘要: ###爬取斗图吧图片 import requests # 模拟请求模块 from bs4 import BeautifulSoup # 格式化模块 import re # 正则模块 import os # 文件操作模块 while True: page = 1 # 记录页数 url = 'https 阅读全文
posted @ 2020-09-23 14:40 最冷不过冬夜 阅读(126) 评论(0) 推荐(0) 编辑