Loading

摘要: references: https://ocw.nctu.edu.tw/course_detail-v.php?bgid=1&gid=1&nid=563 使用贝叶斯算法进行分类 1 基本解读 引例:银行对高危用户的识别,我们以伯努利分布的方式来记录银行高危用户,伯努利分布呢就是二项分布,如果用户是高 阅读全文
posted @ 2022-07-15 21:25 ArkonLu 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 1 长度的定义 1.1 范式(Norm)与长度 范式是一个将数据从N维空间中映射到一维实数空间内的函数,范式是计算向量长度的规则,经由范式求解出的实数就是某一范式下对应的实数,它满足以下三个条件: 长度值大于等于0,当长度为0的时候,范式的输入x必定也为0 两变量和的范式小于等于两变量范式的和 数乘 阅读全文
posted @ 2022-07-08 19:04 ArkonLu 阅读(155) 评论(0) 推荐(0) 编辑
摘要: GraphFrames在pyspark中的使用 1 GraphFrames简要介绍 GraphFrame是将Spark中的Graph算法统一到DataFrame接口的Graph操作接口,为Scala、Java和Python提供了统一的图处理API。 Graphframes是开源项目,源码工程如下:h 阅读全文
posted @ 2022-06-30 17:03 ArkonLu 阅读(1149) 评论(0) 推荐(0) 编辑
摘要: ![image](https://img2022.cnblogs.com/blog/2493318/202206/2493318-20220630150614897-564697048.png) 阅读全文
posted @ 2022-06-30 15:01 ArkonLu 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 序列标注 序列标注是指对一段元素序列中的每一元素或部分元素进行标签标注的任务,对部分元素进行标签标注的任务又称作联合标注,而对每一元素都进行标签标注的任务称为原始标注。 BIO标注 BIO标注就是联合标注的一种,具体地B、I、O 分别表示Begin Inner Other 进一步地来说,B-X表示元 阅读全文
posted @ 2022-03-15 19:04 ArkonLu 阅读(3534) 评论(0) 推荐(1) 编辑
摘要: AJAX技术: AJAX是一种与用户访问服务器资源相关的技术,在传统技术中用户网页的更新需要基于所有数据整界面地更新,这使得网络资源浪费和访问效率下降逐渐成为不可忽视的问题。 Ajax技术的出现在一定程度上解决了这个问题,该技术基于JavaScript和XML,常用json存储数据信息,使得网页信息 阅读全文
posted @ 2022-02-01 16:01 ArkonLu 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 在弄清楚中心极限定理之前,先认清如下一个基本理论: 当样本量n逐渐趋于无穷大时,随机变量样本均值X 服从正态分布。 这个理论表明,无论最原初的样本x(如身高)服从何种分布,当样本量n逐渐趋于无穷大时,其样本均值随机变量X服从正态分布,均值为μ,方差为σ2/n 如下图所示,三种随机变量的分布和它们随机 阅读全文
posted @ 2022-01-15 15:02 ArkonLu 阅读(594) 评论(0) 推荐(0) 编辑