摘要: **背景:** 当SparkStream连接kafka,消费数据时,报错: > object not serializable (class: org.apache.kafka.clients.consumer.ConsumerRecord, value: ConsumerRecord ![](ht 阅读全文
posted @ 2023-07-01 17:53 Norni 阅读(44) 评论(0) 推荐(0) 编辑
摘要: 现象 当我adb remount时报错: 之前我执行过 adb root命令 于是接下来执行:adb disable-verity,但是报错: 分析 需要打开雷电模拟器的磁盘共享为System.vmdk可写入: 参考: https://www.ldmnq.com/forum/89106.html 结 阅读全文
posted @ 2023-02-27 10:06 Norni 阅读(434) 评论(0) 推荐(0) 编辑
摘要: 背景: 在VM中安装了Ubuntu 22.04.1 LTS,但是其无法访问网络。 解决措施: 编辑/etc/NetworkManager/NetworkManager.conf文件,将managed=false设置为managed=true 关闭网络,清除网络缓存 2.1 关闭网络服务:sudo s 阅读全文
posted @ 2022-12-03 02:03 Norni 阅读(2135) 评论(0) 推荐(0) 编辑
摘要: 1、azkaban部署 主要是集群部署安装。 1.1 准备安装包 Downloads (azkaban.github.io) 1.2 配置MySQL 启动mysql mysql -uroot -proot 创建azkaban数据库 create database azkaban; 创建azkaban 阅读全文
posted @ 2022-09-02 00:48 Norni 阅读(132) 评论(0) 推荐(0) 编辑
摘要: 硬件足够硬,软件足够多,这便是一个人才能的护城河。 参考: 书名:《数据化分析 Python 实战 - 林骥 - V6.0》 本书作者(该书由作者整理,本人仅依照其内容整理出个人笔记,如果您感兴趣,可联系作者获取电子书完本): 0、概述 数据赋能系统 1、思维篇 1.1 数据化分析的思维 数据分析的 阅读全文
posted @ 2022-06-12 23:18 Norni 阅读(360) 评论(0) 推荐(0) 编辑
摘要: 1. 实现决策树的前提:信息增益 信息增益: ​ 数据集合在被处理的之前之后,其信息发生的变化称为信息增益。 香农熵或熵: ​ 集合信息的度量方式称为香农熵或者简称为熵。 熵被定义为信息的期望值: 信息的定义 如果存在有多个分类(分类1、分类2...)的条件下,待分类的事务可能被划分为其中某个分类, 阅读全文
posted @ 2022-04-11 23:59 Norni 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 语义原理: k-近邻算法(k-Nearest Neighbor,KNN)。 对于一个样本数据集合,其由特征数据和分类数据组成,特征数据和分类数据间存在对应关系,将其视为训练样本集;对于只存在特征数据的新数据,将其与训练样本集中特征进行比较,然后用算法提取样本集中特征最相似数据(最近邻)的分类标签,作 阅读全文
posted @ 2022-04-06 23:29 Norni 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 1、机器学习概述 机器学习共有六个基本步骤: 问题定义 研究和提炼问题的特征,以帮助我们更好地理解项目的目标。 特征工程 数据理解 通过描述性统计和可视化来分析现有的数据质量和分布。 数据预处理 对数据进行预处理,特征选定,以便于构建一个预测模型。 模型选择 通过一定的方法分离一部分数据,用来评估算 阅读全文
posted @ 2022-04-04 20:39 Norni 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 参考:https://www.cnblogs.com/nuochengze/p/12771782.html 老版本的chrome: http://dist.control.lth.se/public/CentOS-7/x86_64/google.x86_64/ chromedriver: https 阅读全文
posted @ 2022-03-28 09:37 Norni 阅读(104) 评论(0) 推荐(0) 编辑
摘要: 添加参数:encoding="unicode_escape" 阅读全文
posted @ 2022-03-06 11:46 Norni 阅读(105) 评论(0) 推荐(0) 编辑