【机器学习实战】kNN

1.Matplotlib安装出错的原因可能是与所装的Python版本不一样(32位?64位?)

2.Python清屏方法——参照http://www.cnblogs.com/maybego/p/3234055.html 方法2,安装插件

3.kNN工作原理

  输入没有标签(分类)的数据集(test data set测试样本),将新数据与有标签的样本集(training data set)中数据对应的特征进行比较,提取样本集中特征最相似(最近邻)的分类标签。通常,只选择样本数据集前k个最相似的数据。一般地,k <= 20. 最后,选择k个最相似数据中出现次数最多的分类,作为新数据的分类。

4.从文本文件解析数据 file2matrix涉及的一些命令

1 fr = open(filename)
2 arrayOLines = fr.readlines() # 一行行读取
3 numberOfLines  = len(arrayOLines) # 行数

  拆分函数split

 

1 data = open('test.txt')
2  for each_line in data:
3     each_line = each_line.strip()
4     listFromLine = each_line.split(":")
5     print listFromLine

5.使用Matplotlib创建散点图

1 import matplotlib
2 import matplotlib.pyplot as plt
3 fig = plt.figure()
4 ax = fig.add_subplot(111)
5 ax.scatter(x_axis_array, y_axis_array)

 

posted @ 2015-04-22 17:12  LizSep  阅读(182)  评论(0编辑  收藏  举报