09 2019 档案
摘要:最近机器学习的模型需要序列化和反序列化,因为写个博客总结一下几个模型和数据等序列化的模块。
阅读全文
摘要:tqdm 是 Python 进度条库。 tqdm库下面有2个类我们经常使用: 1. 2. 可以在 Python 长循环中添加一个进度提示信息用法:tqdm(iterator) trange(i) 是 tqdm(range(i)) 的简单写法。 可以总结为三个方法: 方法一: 结果如下: 方法二:可以
阅读全文
摘要:昨天和刚来项目的机器学习小白解释了一边什么baseline 和pipeline,今天在这里总结一下什么是baseline和pipeline。 1.pipeline 1.1 从管道符到pipeline 先从在linux的管道符讲起, inux体系下的各种命令工具的处理,可以使用管道符作为传递,这是一种
阅读全文
摘要:1、在java中编译JAR文件的时候我们都会用到,jar这个命令。 2、这样的问题是因为,jar包中的META-INF文件夹下的MANIFEST.MF文件缺少定义jar接口类。说白了就是没有指定class类。这里说明一下MANIFEST.MF就是一个清单文件, 通俗点将就相当于WINDOWS中ini
阅读全文
摘要:1.第一步读入泰坦尼克号数据集 2.通过df的loc的函数从df中取出一列的数据,该数据格式为 : <class 'pandas.core.series.Series'> 会发现数据维度:(891,) 3.数据维度的转换 升维 因为sklearn里面的数据必须是二维 1.使用Series类的 to_
阅读全文
摘要:-D<name>=<value> : set a system property 设置系统属性。 官方解释: 1.java -D参数简化加入多个jar java命令引入jar时可以-cp参数,但时-cp不能用通配符(多个jar时什么烦要一个个写,不能*.jar),面通常的jar都在同一目录,且多于1
阅读全文
摘要:sys.argv[]的作用: 在运行python文件的时候往文件里面传递参数. 从函数外部获取到变量值 import sys arg = sys.argv[0] args = sys.argv[:] print(arg) print(args) 如果此时,我们运行文件: python test.py
阅读全文
摘要:假设:filename=/dir1/dir2/dir3/my.filename.txt 1.单一符号是最小匹配﹔两个符号是最大匹配。 note: 2.对变量值里的字串作替换: 3.利用${ }还可针对不同的变数状态赋值(没设定、空值、非空值):
阅读全文
摘要:注解: #是去掉左边 (在键盘上#在${}之左边) %是去掉右边(在键盘上%在${}之右边) # % %:从左边数第一条,从右边数最后一条 ## % : 从右边数第一条,从左边数最后一条
阅读全文
摘要:1.读取文件的时候重命名 names = new_col,可以在读取文件的时候,给出新列名。 2.全部重命名 columns = new_columns,新列名的长度必须与旧列名一致 3.部分重命名columns = dict,使用字典类型的数据对列进行重命名。 4.使用str.replace
阅读全文
摘要:1、修改graphviz配置文件 <dir>C:\WINDOWS\Fonts</dir> 更改为 <dir>~/.fonts</dir> 2、将决策树dot_data文件保存下来 生成相应的dot文件如下: cmd: 切换到相应目录 3、dot_data文件格式转换 查看保存在本地的 dot_dat
阅读全文
摘要:最近买了一本hive看,发现书中有一个错误: 我的验证如下: 1.外部表数据存在自己表所属的目录下 2.还发现了 CTAS 操作不能 建立外部表
阅读全文
摘要:1.一个表中的数据不存在另一个表中 2.一个表中的数据 存在另一个表中:
阅读全文