摘要:
生活不易啊,公司考核,初步写出来了,脑阔疼。。。 思路: 设定阈值与半径; 计算点之间的距离(欧式距离实现); 区分核心点、边界点与离群点; 将每个点的领域作为一个类(即将密度可达的点归为一个簇); 找出每个独立的领域; 对最后的聚类进行标记; 可视化。 代码实现: 1、设定eps = 2,MinP 阅读全文
摘要:
预测(forecast): 对尚未发生或目前还不明确的事物进行预先的估计和推测,简单来说就是指从已知事件测定未知事件 时间序列预测(Time Series Forecasting): 通过分析时间序列,根据时间序列所反映出来的发展进程、方向和趋势,进行类推或延伸,借以预测下一段时间或若干年内可能达到 阅读全文
摘要:
恢复内容开始 日期和时间数据类型及工具 python标准库包含于日期(data)和时间(time)数据的数据类型,datetime\time以及calendar模块会被经常用到 datetime以毫秒形式存储日期和时间,datetime.timedelta表示两个datetime对象之间的时间差 给 阅读全文
摘要:
恢复内容开始 HTML教程: 超文本标记语言(Hyper Text Markup Language,HTML)是一种用于创建网页的标准标记语言; HTML文档的后缀名 .html .htm 以上两种后缀名没有区别,都可以使用 HTML实例 eg: 解析: <!DOCTYPE html>声明为HTML 阅读全文
摘要:
日期和时间数据类型及工具 python标准库包含于日期(data)和时间(time)数据的数据类型,datetime\time以及calendar模块会被经常用到 datetime以毫秒形式存储日期和时间,datetime.timedelta表示两个datetime对象之间的时间差 给datetim 阅读全文
摘要:
概念 时间序列(Time Series) 时间序列是均匀时间间隔上的观测值序列 时间序列分析(Time Series Analysis) 趋势分析 序列分解 序列预测 时间序列分解(Time-Series Decomposition) 时间写按照季节性来分类,分为季节性时间序列和非季节性时间序列 非 阅读全文
摘要:
关联规则方法: 使用apyori包中的apriori方法,该方法传入训练样本,用一个数组把一个样板存储起来,接着是使用数组把所有的样本存储起来 阅读全文
摘要:
HTML教程: 超文本标记语言(Hyper Text Markup Language,HTML)是一种用于创建网页的标准标记语言; HTML文档的后缀名 .html .htm 以上两种后缀名没有区别,都可以使用 HTML实例 eg: 解析: <!DOCTYPE html>声明为HTML5文档 <ht 阅读全文
摘要:
概念 聚类分析:是按照个体的特征将它们分类,让同一个类别内的个体之间具有较高的相似度,不同类别之间具有较大差异性 无分类目标变量(Y)——无监督学习 K-Means划分法、DBSCAN密度法、层次聚类法 1、导入数据 1 import pandas 2 from sklearn.cluster im 阅读全文
摘要:
如何选择特征 根据是否发散及是否相关来选择 方差选择法 先计算各个特征的方差,根据阈值,选择方差大于阈值的特征 方差过滤使用到的是VarianceThreshold类,该类有个参数threshold,该值为最小方差的阈值,然后使用fit_transform进行特征值过滤 相关系数法 先计算各个特征对 阅读全文