摘要:
什么是大数据? 维基百科:大数据是指无法在容许的时间内用常规的软件工具对其内容进行抓取、管理和处理的数据集合,大数据规模的标准是持续变化的,当前泛指单一数据集的大小在十几TB和PB之间。 大数据:不能集中存储、难以在可接受时间内分析处理、而数据整体呈现高价值的海量复杂数据集。 大数据一般... 阅读全文
摘要:
AP聚类算法是基于数据点间的"信息传递"的一种聚类算法。与k-均值算法或k中心点算法不同,AP算法不需要在运行算法之前确定聚类的个数。AP算法寻找的"examplars"即聚类中心点是数据集合中实际存在的点,作为每类的代表。算法描述: 假设$\{ {x_1},{x_2}, \cdots ,{x_... 阅读全文
摘要:
子图同构定义: 给定图$Q=(V(Q),E(Q),L_V,F)$和$G=(V(G),E(G),L_V',F')$, 称$Q$子图同构于$G$ 当且仅当存在一个映射$g:V(Q)\rightarrow V(G)$ 使得\[\forall x\in V(Q), F(v)=F'(g(v))\]和\[\... 阅读全文
摘要:
BP神经网络基本原理 BP神经网络是一种单向传播的多层前向网络,具有三层或多层以上的神经网络结构,其中包含输入层、隐含层和输出层的三层网络应用最为普遍。 网络中的上下层之间实现全连接,而每层神经元之间无连接。当一对学习样本提供给网络后,神经元的激活值从输入层经各中间层向输出层传播,在输出层... 阅读全文
摘要:
1.感知器算法来源和基本思想 “感知器”一词出自于20世纪50年代中期到60年代中期人们对一种分类学习机模型的称呼,它是属于有关动物和机器学习的仿生学领域中的问题。当时的一些研究者认为感知器是一种学习机的强有力模型,后来发现估计过高了,但发展感知器的一些相关概念仍然沿用下来。 采用感知器算法... 阅读全文
摘要:
势函数主要用于确定分类面,其思想来源于物理。 1 势函数法基本思想 假设要划分属于两种类别$\omega_1$和$\omega_2$的模式样本,这些样本可看成是分布在$n$维模式空间中的点$x_k$。 把属于$\omega_1$的点比拟为某种能源点,在点上,电位达到峰值。 随着与该点距离的增大,电位... 阅读全文
摘要:
Subgraph Search Over Large Graph Database Problem DefinitionGiven a graph database and a query graph, discover all graphs containing this query graph.... 阅读全文
摘要:
k-means算法: 第一步:选$K$个初始聚类中心,$z_1(1),z_2(1),\cdots,z_k(1)$,其中括号内的序号为寻找聚类中心的迭代运算的次序号.聚类中心的向量值可任意设定,例如可选开始的$K$个模式样本的向量值作为初始聚类中心。 第二步:逐个将需分类的模式样本$\{x\}$按... 阅读全文
摘要:
1. 与K-均值算法的比较 –K-均值算法通常适合于分类数目已知的聚类,而ISODATA算法则更加灵活; –从算法角度看, ISODATA算法与K-均值算法相似,聚类中心都是通过样本均值的迭代运算来决定的; –ISODATA算法加入了一些试探步骤,并且可以结合成人机交互的结构,使其能利用中间结果所取 阅读全文
摘要:
1. 与K-均值算法的比较–K-均值算法通常适合于分类数目已知的聚类,而ISODATA算法则更加灵活;–从算法角度看, ISODATA算法与K-均值算法相似,聚类中心都是通过样本均值的迭代运算来决定的;–ISODATA算法加入了一些试探步骤,并且可以结合成人机交互的结构,使其能利用中间结果所取得的经... 阅读全文