09 2023 档案
摘要:上一篇介绍了逻辑回归算法,发现分类效果不好,通过这次的svm发现是因为训练数据不行,于是网上找了部分训练数据,发现实际上分类效果还可以。 训练数据,第一个值是标签,下面的数据是某种花的相关特征。 1|5.1,3.5,1.4,0.2 1|4.9,3,1.4,0.2 1|4.7,3.2,1.3,0.2
阅读全文
摘要:本地小数据量测试了一下Spark的LogisticRegressionWithSGD算法,效果不尽如人意。 数据样例如下,竖杠前的0,1代表两种类型,后面逗号隔开的是两个特征,两个特征只要有一个大于等于0.6就会被分为1这一类,否则就是0。 1|0.3,0.6 0|0.2,0.1 1|0.5,0.6
阅读全文
摘要:1.背景 最近整理以前的文件,发了一篇有意思的关于极验验证码破解思路的文章。现在回过头来思考感觉挺有意思的,分享给大家。 百度百科对极验的定义如下: 极验验证是一种在计算机领域用于区分自然人和机器人的,通过简单集成的方式,为开发者提供安全、便捷的云端验证服务。与以往传统验证码不同的是,极验通过分析用
阅读全文
摘要:最近看了以前写的Sqoop脚本,就顺手整理一下数据导入导出的相关参数使用方法及解释。 参数 解释 --connect <jdbc-uri> 关系数据库连接地址,比如mysql的 jdbc:mysql://xx.x.35.xx:3306/mytest --connection-manager <cla
阅读全文
摘要:最近看了以前写的Sqoop脚本,就顺手整理一下数据导入导出的相关参数使用方法及解释。 参数 解释 --connect <jdbc-uri> 关系数据库连接地址,比如mysql的 jdbc:mysql://xx.x.35.xx:3306/mytest --connection-manager <cla
阅读全文