摘要:
阅读全文
摘要:
朴素贝叶斯(Naive Bayes)是贝叶斯分类器(Bayesian classifier)的扩展,是贝叶斯决策论(Bayesian decision theory)的一部分。贝叶斯决策论的核心思想是选择有最高概率的决策(分类)。举个例子,有一天你走在路上听到一群狼嚎,你知道那肯定不是真的老虎,而是... 阅读全文
摘要:
Git配置:在电脑中安装git,打开git shell,设置名字与emailgit config --global user.name "YourName"git config --global user.email "YourEmail@gmail.com"Git基本操作:1. 打开git sh... 阅读全文
摘要:
Hive 是一个基于Hadoop分布式文件系统(HDFS)之上的数据仓库架构,同时依赖于MapReduce。适用于大数据集的批处理,而不适用于低延迟快速查询。Hive将用户的HiveQL语句转换为MapReduce作业提交到Hadoop集群上,监控执行过程,最后返回结果给用户。由于Hive的元数据(... 阅读全文
摘要:
1.参数模型(parametric models)与非参数模型(non-parametric models)模型是否有固定数目的参数?若是则为参数模型,若参数数目随着训练数据集增大而增加则为非参数模型。一般而言,参数模型更快,然而却对数据分布特性进行了更强的假设。非参数模型则更加灵活,但是对于大数据... 阅读全文
摘要:
1. 简介TLD目标跟踪算法是Tracking-Learning-Detection算法的简称。这个视频跟踪算法框架由英国萨里大学的一个捷克籍博士生Zdenek Kalal提出。TLD将传统的视频跟踪算法的跟踪模块(Tracker)与检测模块(Detector)结合起来,同时加入了学习(Learni... 阅读全文
摘要:
1. 数据库操作 database managementcreate database sampleDatabase; --创建数据库sampleDatabaseshow databases; --显示已有的数据库use sampleDatabase; --开始使用sampleDatab... 阅读全文
摘要:
k近邻(k-NearestNeighbor)算法简称kNN。基本思想简单直接,对于一个需要分类的数据实例x,计算x与所有已知类别的样本点在特征空间中的距离。取与x距离最近的k个样本点,统计这些样本点所属占比最大的类别,作为x的分类结果。下图中与绿色点最近的3个点中,2个属于红色类别,则认为x属于红色... 阅读全文
摘要:
1. range()函数的使用:a = range(n) # a = range(0,n)b = range(m,n) # b = range(m,n)alist = list(a) # alist = [0, 1, ... , n-1]blist = list(b) # blist = [m,... 阅读全文