数据科学导论 数学基础 统计
搜索引擎:排序算法
大规模网页排序:pagerank
标准差:样本的发散性
统计分析:用概率论来建模 量化随机性和不确定性
描述性统计:求集合的均值和方差
探索性统计分析:Titanic头等舱和生死的关系上的联系
协方差矩阵:两个变量间是否有关系
概率
条件概率:在已知一些条件后算概率
贝叶斯公式
量化信息的价值:量化数据的价值
随着数据越来越多,不确定性越来越少
独立事件P(A)=P(A|B) A B独立
相关事件 在数据分析 数据挖掘中挖掘相关事件 通过相关因素来建模
随机变量 对事件产生结果的值
刻画随机变量的方法 方差 协方差
可视化 求函数分布 最重要的 正态分布(钟型曲线)