摘要: 原始两个文本customer.txt:23115823|3115823|aaaaaa|20030819000000|20040420000000|A|CTC-BJ|B23|0|N|0|0 custservice.txt:23115823|fw001|N|1|999912000000|0 脚本执行组合后:23115823~_~23115823~_~aaaaaa~_~20030819000000~... 阅读全文
posted @ 2016-11-01 23:29 JonyQ 阅读(292) 评论(0) 推荐(0) 编辑
摘要: K-近邻 K-NN 可简单理解为 近朱者赤近墨者黑 欧式距离 文本分类计算时 余弦策略 MBR Memory-Based Reasoning 记忆基础推理法 Collaborative Filtering 协同过滤 应用场景 稀疏事件 医疗-罕见病 反欺诈 计算步骤 1、算距离 2、找邻居 3、做分 阅读全文
posted @ 2016-10-24 09:30 JonyQ 阅读(178) 评论(0) 推荐(0) 编辑
摘要: 了解统计学 实用统计 教材 高老师 人大吴喜之老师的 《从数据到结论》 教材和资料 需要懂点统计 population 数据全集 sample 一部分数据 实际处理数据 基本为样本 statistics 统计量 《女士品茶》 统计发展史 mean 平均值 median 中位数 mode 众数 出现最 阅读全文
posted @ 2016-10-15 21:05 JonyQ 阅读(158) 评论(0) 推荐(0) 编辑
摘要: 创建虚拟帐号后,使用命令行和工具访问均会因为ssh报密码错误,使用文件目录访问即可。 深深的痛啊,为什么pam之后的虚拟用户本地sftp 无法登录呢?。 Oct 12 18:56:04 fort sshd[32858]: Invalid user pso1 from 127.0.0.1Oct 12 阅读全文
posted @ 2016-10-13 00:26 JonyQ 阅读(1047) 评论(1) 推荐(0) 编辑
摘要: aaa.py 文件已经设置 #!/usr/bin/env python3# coding = 'utf-8' 但执行总是报错 但我在python3环境下为什么一直错误呢? 通过修改代码中的编解码中文等操作均无效,折腾半天考虑 有没有是linux语言环境变量的问题 检查当前shell环境 $ echo 阅读全文
posted @ 2016-10-08 15:39 JonyQ 阅读(1199) 评论(0) 推荐(0) 编辑
摘要: 简单实例: 阅读全文
posted @ 2016-10-08 09:15 JonyQ 阅读(464) 评论(0) 推荐(0) 编辑
摘要: 学习excel读写,将一个excel文件内容转换为dict用于后续处理,将dict写入excel 阅读全文
posted @ 2016-10-04 16:52 JonyQ 阅读(15738) 评论(0) 推荐(0) 编辑
摘要: 解析使用xml.etree.ElementTree 模块,生成使用xml.dom.minidom模块, ElementTree比dom快,dom生成简单且会自动格式化。 解决 字典无顺序导致生成的xml文件参数位置不固定,对dict_to_xml()函数进行修正: 阅读全文
posted @ 2016-10-03 14:12 JonyQ 阅读(28508) 评论(1) 推荐(1) 编辑
摘要: 大于20都属于k1,小于等于属于k2 阅读全文
posted @ 2016-09-30 23:07 JonyQ 阅读(186) 评论(0) 推荐(0) 编辑
摘要: 1、center 将内容填入*的中间,效果为******Colum******* 2.count 计算输入参数的数量 3.decode 解码 encode 编码 4.expandtabs 将tab变为空格,也可以用\t 替换空格实现 He is 2*tab 5.find index 查找参数,返回位 阅读全文
posted @ 2016-09-29 22:03 JonyQ 阅读(164) 评论(0) 推荐(0) 编辑