摘要:
1.dataset大小的解读,除了可以从数据量少,选择机器学习,迁移学习,数据量大选深度学习以外; 2. 还可以从文件完整性的角度去解读: 有缺失文件时,可以用 生成式模型(BN,MN,MC,HMM),部分判别式模型需要完整数据 3. 判别式模型的优点:训练数据需求较少,有更低的error 4. d 阅读全文
摘要:
https://blog.csdn.net/weixin_33894640/article/details/93756895 阅读全文
摘要:
https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html 阅读全文
摘要:
处理nan的一些方法: 1. drop掉出现na的行或者列 1) drop行 axis = 0; drop列 axis =1 2) 如果出现一个nan就drop how = 'any' ; 全是NAN才drop how = 'all' 2. 用固定值或者均值去填充df 或者 df的某一列 1)df. 阅读全文
摘要:
给选中df赋值 1. 通过 loc iloc 选中并赋值 2. 通过boolean条件 给rows 中的全部columns或者特定的列赋同样的值 df[df.A>4] = 0 df.B[df.A>4] = 0 3. 添加新的一列 需要用到 pd.Series(data,index) https:// 阅读全文
摘要:
索引pandas DataFrame的方法总结 1. 直接用中括号索引 行或者列 : 1) 用 df['A'] 索引列 或者 df.A 2) 用切片索引行 df[1:3] 或者 df['20130101':'20130103'] 2. 用 df.loc[] 索引 ,如果用 切片 或 list 只能用 阅读全文
摘要:
在根据row,通过data.iloc[:] 来切分数据时,其中的index不会改变,如果我们在之后的数据中使用index,就会遇到不连续的情况; https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.r 阅读全文
摘要:
写9418作业时,复制一个字典,结果发现在新字典上操作一直会修改老字典 才发现需要是没有将value的地址也改过来 GG newDict = {k:v[:] for k,v in d.items()} https://stackoverflow.com/questions/5105517/deep- 阅读全文
摘要:
https://blog.csdn.net/qq_27009517/article/details/80044431 阅读全文
摘要:
http://www.cse.unsw.edu.au/~cs6714/20t3/index.html 用放缩将log累乘变成Log累加 阅读全文