摘要: 线性回归的定义 利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式 线性回归的分类 线性关系 非线性关系 损失函数 最小二乘法 线性回归优化方法 正规方程 梯度下降法 正规方程 -- 一蹴而就 利用矩阵的逆,转置进行一步求解 只是适合样本和特征比较少的情 阅读全文
posted @ 2019-12-14 18:07 沐军 阅读(378) 评论(0) 推荐(0) 编辑
摘要: 索引 学习目标 能够写出创建索引的SQL语句 1. 索引的介绍 索引在MySQL中也叫做“键”,它是一个特殊的文件,它保存着数据表里所有记录的位置信息,更通俗的来说,数据库索引好比是一本书前面的目录,能加快数据库的查询速度。 应用场景: 当数据库中数据量很大时,查找数据会变得很慢,我们就可以通过索引 阅读全文
posted @ 2019-12-10 21:31 沐军 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 特征工程 特征提取 特征预处理 特征降维 降维的俩种方式 特征选择 主成分分析-特征提取的一种方式 特征选择 定义:数据中包含冗余或无关变量(特征,属性,指标)。旨在从原因特征中 方法 Fillter(过滤式)主要探究特征本身特点,特征与特征和目标值之间关联 方差选择法:低方差特征过滤 相关系数 E 阅读全文
posted @ 2019-11-19 10:37 沐军 阅读(144) 评论(0) 推荐(0) 编辑
摘要: 编码方式和解码方式必须保持一致 HTTPS=HTTP(超文本传输协议)+SSL(安全套接字层),port:443 爬虫模拟浏览器发送请求,获取响应,一种按照一定的规则,自动的抓取互联网信息的程序 只要是浏览器能做的事情,原则上,爬虫都可以做 聚焦爬虫,url-->发送请求,获取响应-->提取url- 阅读全文
posted @ 2019-11-18 20:54 沐军 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 总结: select左侧尽量避免* where条件比较符左侧避免函数 尽量避免使用in和not in,会进行全表扫描 尽量避免使用or,会进行全表扫描 使用limit限制返回的数据行数 待补充.............................. 阅读全文
posted @ 2019-11-18 15:31 沐军 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 结巴分词:jieba.cut() 决策树 集成学习 无监督学习 tf-idf文本特征提取 tf 词频 idf 逆向文档频率 tf-idf 思想:一篇文章中出现多次,其他文章很少出现 TF-IDF作用:用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。 词频(term frequen 阅读全文
posted @ 2019-11-18 15:29 沐军 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 清华大学下载镜像源 阿里云 http://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/ 豆瓣(douban) http://pypi.douban.com/simple/ 清华大学 ht 阅读全文
posted @ 2019-11-15 22:48 沐军 阅读(741) 评论(0) 推荐(1) 编辑
摘要: K-近邻算法 K-K个 N-nearest-最近 N-Neighbor 来源:KNN算法最早是由Cover和Hart提出的一种分类算法 定义 如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 距离公式 两个样本的距离可以通过如下公式计 阅读全文
posted @ 2019-11-13 11:42 沐军 阅读(1039) 评论(0) 推荐(0) 编辑
摘要: 一、概念: python定时任务框架,基于日期,固定时间间隔,crontab类型的任务,并且可以持久化任务,并能以deamon守护方式运行任务 二、简介: 安装:pip install apscheduler 其中7中调度器: BackgroundScheduler:如果希望调度器在后台执行使用 B 阅读全文
posted @ 2019-11-12 22:01 沐军 阅读(967) 评论(0) 推荐(0) 编辑
摘要: 人工智能必备三要素数据算法计算力 cpu io密集型任务 gpu 计算密集型 tpu 谷歌 人工智能》机器学习》深度学习--包含1950 1980 2010 关系机器学习是人工智能的一个实现途径深度学习是机器学习的一个方向发展而来 起源 艾伦麦席森图灵 计算机之父 图灵测试 达特茅斯会议 --195 阅读全文
posted @ 2019-11-12 20:12 沐军 阅读(164) 评论(0) 推荐(0) 编辑