摘要: https://www.jianshu.com/p/47f66ff4ab7b 阅读全文
posted @ 2021-12-10 11:17 收购阿里巴巴 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 1:支持向量机 拟解决问题:如何选择一条分的开并且能够分的好的线? 解决办法:找到一条线(w和b),使得离该线最近的点距离最远。 公式推导:点到直线的距离? 第一步:建模,推出点到直线的一般距离公式distance(x,b,w) 【注】wTx'+b=0(即a*x+b*y+c*z+b=0)为一个平面方 阅读全文
posted @ 2021-12-04 20:03 收购阿里巴巴 阅读(67) 评论(0) 推荐(0) 编辑
摘要: 1:matplotlib 2:seaborn 阅读全文
posted @ 2021-12-03 23:05 收购阿里巴巴 阅读(54) 评论(0) 推荐(0) 编辑
摘要: 1:决策树 1.1决策树可以分为两个阶段 1.2:熵和Gini系数: 【注】熵和Gini系数的特点(内部越混乱则熵或Gini系数值越大,否则越小) 熵和Gini系数拟解决的问题:熵和Gini系数的引入是为了判断谁作为决策树的根节点? 如何解决:通过信息增益(gain(某一属性/特征)=原始熵值-节点 阅读全文
posted @ 2021-11-02 10:58 收购阿里巴巴 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 1:transformer结构 2:单个的encoder 2.1输入部分 2.1.1embedding 2.1.2位置编码 【注】RNN是按照时间线展开,单词的先后顺序没有被忽略。而transformer是并行处理的,故增快了速度,忽略了单词之间的先后顺序。 2.2注意力机制 2.2.1注意力机制 阅读全文
posted @ 2021-09-28 00:14 收购阿里巴巴 阅读(98) 评论(0) 推荐(0) 编辑
摘要: 1:NFStream简介 NFStream是一个Python框架,提供快速、灵活和富有表现力的数据结构,旨在使在线或离线网络数据的工作既简单又直观。它的目标是成为在Python中进行实际的、真实的网络数据分析的基本高级构建块。此外,它还有一个更广泛的目标,即成为一个通用的网络数据分析框架,为研究人员 阅读全文
posted @ 2021-09-22 16:55 收购阿里巴巴 阅读(720) 评论(0) 推荐(0) 编辑
摘要: 【注】scapy不适合网络数据包的分析 1:构造包以及发送包 包的构造:pkt=IP()/TCP() 包的发送: res.summary()查看返回包的简要信息。 res.show()详细查看信息。 【注】sr1()发送之后,只接收一个;sr()发送之后,全部接收;send()只发送不接收;假如p之 阅读全文
posted @ 2021-09-22 15:23 收购阿里巴巴 阅读(49) 评论(0) 推荐(0) 编辑
摘要: 1:思考 统计出数据中不同类型的紧急情况的次数: 问题1: 方法1: 方法2: 问题2: 统计出不同月份不同类型的紧急电话的次数的变化情况: 方法1(处理时间序列类型的问题没有方法2【pandas中的时间序列】简单): 方法2:pandas中的时间序列 【注】dir()查询参数i的所有方法 2:pa 阅读全文
posted @ 2021-09-22 11:07 收购阿里巴巴 阅读(47) 评论(0) 推荐(0) 编辑
摘要: 1:pandas常用统计方法 2:数据的合并和分组聚合 2.1 [注]plt.figure()参数详解请参考http://www.yuepc.com/a/1507.html 2.2数据合并之join [注]t1.join(t2)则以t1为基准,t2.join(t1)则以t2为基准。如下: [注]如果 阅读全文
posted @ 2021-09-19 21:31 收购阿里巴巴 阅读(79) 评论(0) 推荐(0) 编辑
摘要: 1:pandas的创建 1.1pandas的常用数据类型 1.2pandas之Series创建 1.2.1通过列表创建 1.2.2通过字典创建 [注]可以和numpy相同,使用Series.astype(datatype)修改dtype。例如:a.astype(float) 1.2.3:pandas 阅读全文
posted @ 2021-09-13 17:54 收购阿里巴巴 阅读(72) 评论(0) 推荐(0) 编辑