摘要: Hi! 我现在呢还是学生,想想初中的同学都结婚生子了,自己,嗯。(啊!!!) 本科以及硕士读的都是应用统计 在这里请广大网友多多指教了! 如果有机会的话,大家可以一起造轮子 you can catch me at qq:1467102273 另一个博客是这个:SunForfive。 这个是我的照片博 阅读全文
posted @ 2020-08-14 23:13 HuangB2ydjm 阅读(150) 评论(0) 推荐(0) 编辑
摘要: twint & tf https://towardsdatascience.com/analyzing-tweets-with-nlp-in-minutes-with-spark-optimus-and-twint-a0c96084995f https://pielco11.ovh/posts/tw 阅读全文
posted @ 2021-11-18 21:16 HuangB2ydjm 阅读(35) 评论(0) 推荐(0) 编辑
摘要: hf入市学习篇 #0001 阅读全文
posted @ 2021-11-07 01:50 HuangB2ydjm 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 欠采样的逻辑中往往会结合集成学习来有效的使用数据,假设正例数据n,而反例数据m个。我们可以通过欠采样,随机无重复的生成(k=n/m)个反例子集,并将每个子集都与相同正例数据合并生成k个新的训练样本。我们在k个训练样本上分别训练一个分类器,最终将k个分类器的结果结合起来,比如求平均值。这就是一个简单的 阅读全文
posted @ 2021-04-01 21:45 HuangB2ydjm 阅读(58) 评论(0) 推荐(0) 编辑
摘要: 1 在机器学习问题中,我们通过训练数据集学习得到的其实就是一组模型的参数,然后通过学习得到的参数确定模型的表示,最后用这个模型再去进行我们后续的预测分类等工作。在模型训练过程中,我们会对训练数据集进行抽象、抽取大量特征,这些特征中有离散型特征也有连续型特征。若此时你使用的模型是简单模型(如LR),那 阅读全文
posted @ 2021-04-01 19:39 HuangB2ydjm 阅读(67) 评论(0) 推荐(0) 编辑
摘要: ggplot2 : the grammar of graphics 哲学 :点到图像的映射 title 标题 subtitle 副标题 panel 面板绘图区 background 背景板 geoms 几何对象 legend title 图例标题 legend labels 图例标签 legend 阅读全文
posted @ 2021-02-07 01:33 HuangB2ydjm 阅读(56) 评论(0) 推荐(0) 编辑
摘要: 数字成像中的颜色直方图是对给定图像中具有相同颜色的像素的频率进行计算的一种方法。这种方法通常被转换成一个图形,以帮助分析和调整图像中的平衡。几乎所有的照片编辑软件和大量的数码相机都具有颜色直方图的查看 数字成像中的颜色直方图是对给定图像中具有相同颜色的像素的频率进行计算的一种方法。这种方法通常被转换 阅读全文
posted @ 2020-09-22 23:35 HuangB2ydjm 阅读(2178) 评论(0) 推荐(0) 编辑
摘要: 历经5天,博客园中最具体的minhash介绍,LSH介绍 阅读全文
posted @ 2020-08-14 19:47 HuangB2ydjm 阅读(876) 评论(0) 推荐(0) 编辑
摘要: 一些拉机网站,再改改? 阅读全文
posted @ 2020-08-14 01:04 HuangB2ydjm 阅读(1019) 评论(0) 推荐(0) 编辑
摘要: 哈希,就是将不同的输入映射成独一无二的、固定长度的值,又称为哈希值,如果不同的输入得到了相同的哈希值,就发生了哈希冲突collision 举例来说,很多网络服务会使用哈希函数,产生一个 token,标识用户的身份和权限。 AFGG2piXh0ht6dmXUxqv4nA1PU120r0yMAQhuc1 阅读全文
posted @ 2020-08-10 23:35 HuangB2ydjm 阅读(317) 评论(0) 推荐(0) 编辑