摘要:
# -*- coding: utf-8 -*- import json # Aprior算法 def loadDataSet(): '''创建一个用于测试的简单的数据集''' test_app=[] phone_app = json.load(open("phone_app.json")) for item in phone_app.keys(): ... 阅读全文
摘要:
当在枚举一些元素的时候,每个元素需要创建不同的变量应该怎么写? 这个时候可以利用loads()创建动态变量! 例如: 创建变量后在别的地方调用的时候把字符转为变量即可: 阅读全文
摘要:
在用python的lxml模块读取一个xml元素的时候,如果节点里面的属性包含中文,etree.tostring方法默认输出会出现乱码 必须要设置方法 method=‘html’才能正常输出中文: 阅读全文
摘要:
一、在搭建好环境之后如果在安装了 spark-1.6-bin-without-hadoop (spark.apache.org/download) 之后,在python 中 “import pyspark” 会报“no module named pyspark” 错误。 解决办法: 在本地使用spa 阅读全文
摘要:
以前生成一段时间序列一直是用time库去循环判断,今天才知道在pandas里面有date_range()函数可以直接生成 例如: import pandas as pd from datetime import datetime def datelist(beginDate, endDate): # 阅读全文
摘要:
我们可以用python里面的time模块mktime方法将转为unix时间戳,mktime函数只能接受相应时间的元祖序列。在此之前需要先将输入的时间转为元组序列: 如果输入的时间为指定格式的,则可以用strptime() 函数根据指定的格式把一个时间字符串解析为时间元组, 例如:time.strpt 阅读全文
摘要:
把字典的值初始化为一个列表再加数据进去: for index,item in enumerate(cols): cols_dict.setdefault(item,[]).append(index) 列表中有中文,join连接输出: '\t'.join(i.decode('utf-8') for i 阅读全文
摘要:
编程有一个原则DRY=Don’t Repeat Yourself,就是说你的代码不要重复来重复去的,这个原则同样可以用于理解动态规划,动态规划除了满足最优子结构,它还存在子问题重叠的性质,我们不能重复地去解决这些子问题,所以我们将子问题的解保存起来,类似缓存机制,之后遇到这个子问题时直接取出子问题的 阅读全文
摘要:
遇到一个问题:控制窗口能正常输出中文,>到文本文件里却是乱码。最后解决了,总结一下Python中文编码的坑。 开始感觉非常奇怪,想第一行为什么是正常的?之后注意到文本文件为ANSI编码,第一行在代码里面是字符串的形式输出来的,而且代码的文本格式也为ANSI。 后面不正常的数据是在列表用utf-8编码 阅读全文
摘要:
在notepad++中直接运行python代码 在notepad++中直接运行Python代码 1.在notepad++的plugin manager中安装“pynpp”2.在plugin manager中找到“pynpp”后,选择“install”,插件会自动安装,并提示是否需要重新启动notep 阅读全文