柒久酒 - 博客园

2024年7月10日

摘要： zip( ) 的作用 b = ["red", "green", "blue"] c = ["leopard", "cheetah", "jaguar"] for x,y in zip(b,c): print(x, y) 输出： red leopard green cheetah blue jagua 阅读全文

posted @ 2024-07-10 14:51 柒久酒阅读(7) 评论(0) 推荐(0) 编辑

2023年12月27日

linux基础

摘要：创建目录：mkdir 修改文件属性权限：chmod (change mode) 编辑权限：vim 保存并退出编辑：按esc + :wq! 展开文件属性以及文件所属的用户和组： ll 或 ls -l 更改文件属性 chgrp：更改文件属组 | chgrp [-R] 属组名文件名 | -R表示递归更阅读全文

posted @ 2023-12-27 14:41 柒久酒阅读(3) 评论(0) 推荐(0) 编辑

2021年7月1日

python 报错"UnicodeDecodeError: 'utf-8' codec can't decode byte"的解决办法

摘要：读取h5 文件时报错： python 报错"UnicodeDecodeError: 'utf-8' codec can't decode byte" 法一：MS = pd.read_csv("path",encoding = "ISO-8859-1", engine='python',delimit 阅读全文

posted @ 2021-07-01 15:11 柒久酒阅读(1488) 评论(0) 推荐(0) 编辑

2021年6月22日

onehot后导致维数激增的解决方法

摘要：独热编码应用于有许多类的列时，会导致并行性和多重共线性问题。解决方式有： ①限制n个最常见的类别（可覆盖约95%的数量） ②频率编码：用其计数或者频率代替某个类别（最常用）。缺点：若计数相同，则模型做相同处理导致信息丢失 ③目标编码：用该类别的平均目标值作为一维数值向量 ④嵌入：对于文本数据类型或阅读全文

posted @ 2021-06-22 14:03 柒久酒阅读(700) 评论(0) 推荐(0) 编辑

2021年4月23日

python compile()

摘要： compile() 函数将一个字符串编译为字节代码。 compile(source, filename, mode[, flags[, dont_inherit]]) source -- 字符串或者AST（Abstract Syntax Trees）对象。。 filename -- 代码文件名称，如阅读全文

posted @ 2021-04-23 15:31 柒久酒阅读(81) 评论(0) 推荐(0) 编辑

序列预处理pad_sequences()序列填充

摘要：由于keras只能接受长度相同的序列输入 keras.preprocessing.sequence.pad_sequences(sequences, maxlen=None, dtype='int32', padding='pre', truncating='pre', value=0.) sequ 阅读全文

posted @ 2021-04-23 14:57 柒久酒阅读(911) 评论(0) 推荐(0) 编辑

numpy.array( )

摘要： numpy.array(object,dtype = None,copy = True, order ='K',subok = False,ndmin =0) 数组属性： arange：创建等差数组通过索引找数组位置阅读全文

posted @ 2021-04-23 11:00 柒久酒阅读(95) 评论(0) 推荐(0) 编辑

2021年4月22日

python qurey()

摘要： qurey()方法可以找到特定的行需要注意1.如果数据是dataframe类型，那么需要这样输出筛选出的每一行for index,row in data.query(“nameXXX").iterrows()2. 如果XXX是一个变量，那么可以用@XXX的方式来引用这个东西for index,row 阅读全文

posted @ 2021-04-22 21:48 柒久酒阅读(90) 评论(0) 推荐(0) 编辑

文本的向量化表达

摘要：阅读全文

posted @ 2021-04-22 11:28 柒久酒阅读(52) 评论(0) 推荐(0) 编辑

文本分词

摘要： 1.正向/逆向最大匹配法 2.NLP概率图：HMM针对中文分词应用——Viterbi算法统计学思想：Viterbi算法找出一条概率最大路径（最短的马尔科夫链） jieba支持三种分词：固有分词繁体分词自定义词典阅读全文

posted @ 2021-04-22 09:50 柒久酒阅读(62) 评论(0) 推荐(0) 编辑

公告