【机器学习实战】kNN
1.Matplotlib安装出错的原因可能是与所装的Python版本不一样(32位?64位?)
2.Python清屏方法——参照http://www.cnblogs.com/maybego/p/3234055.html 方法2,安装插件
3.kNN工作原理
输入没有标签(分类)的数据集(test data set测试样本),将新数据与有标签的样本集(training data set)中数据对应的特征进行比较,提取样本集中特征最相似(最近邻)的分类标签。通常,只选择样本数据集前k个最相似的数据。一般地,k <= 20. 最后,选择k个最相似数据中出现次数最多的分类,作为新数据的分类。
4.从文本文件解析数据 file2matrix涉及的一些命令
1 fr = open(filename) 2 arrayOLines = fr.readlines() # 一行行读取 3 numberOfLines = len(arrayOLines) # 行数
拆分函数split
1 data = open('test.txt') 2 for each_line in data: 3 each_line = each_line.strip() 4 listFromLine = each_line.split(":") 5 print listFromLine
5.使用Matplotlib创建散点图
1 import matplotlib 2 import matplotlib.pyplot as plt 3 fig = plt.figure() 4 ax = fig.add_subplot(111) 5 ax.scatter(x_axis_array, y_axis_array)