摘要:
方法 把对象划分为k个非空的子集 随机的选择一些种子点作为目前划分的簇的质心。质心是簇的中心(平均点) 把每一个对象赋给最近的种子点 重复第二步,直到没有新的分配 优点 • 复杂度: $O(tkn)$, 其中 n 是对象的数目, k 是簇的数目, t 是 迭代的次数. 通常 k, $t << n$. 阅读全文
摘要:
Binary Variables,只有两种结果,如 Yes 或者 No,True 或者False.... 这里表示为Positive 和 Negative 二元变量属性间的相似度(similarity)和不相似度(dissimilarity)就可以用Positive 和 Negative出现的频率( 阅读全文
摘要:
宏观数据库 国家统计局:www.stats.gov.cn/ 国研网(国务院发展研究中心):www.drcnet.com.cn/ 中经网(国家信息中心):www.cei.gov.cn/ 《中经网统计数据库》:http://db.cei.gov.cn 《中经网产业数据库》:http://cyk.cei. 阅读全文
摘要:
初始配置 import numpy as np import pandas as pd from pandas import Series, DataFrame # 下面两个方法都可以 frame = DataFrame(np.arange(9).reshape(3,3), columns=['a' 阅读全文