数学之美总结
吴军博士的《数学之美》给了我很大启发,让我懂得了以下几点:
1、那些有卓越成就的人,首先是世界级的技术专家,最后才将技术转换成商业,人应用有自己专长的研究领域,并在这个领域在全世界有名次。
2、区别卓越的工程师和三流的工程师在于你知晓并能改进数学之美中提高的信息科学的前沿研究问题和应用问题。
读这本书的时候,有一些欣喜,主要是李宗民老师的模式识别课程中提高的很多东西,都在现实中看到了价值,其次上学期学的应用统计方法,矩阵理论,高级数理逻辑,以及数据结构和算法的威力让我很开心。给了我努力钻研和研究的正能量。
下面对本书的思路进行一下梳理,也算是一个总结:
1、自然语言处理
从规则到统计
信息论
人工智能
句法分析
乔姆斯基形式语言与自动机
数据挖掘算法
2、统计语言模型
马尔可夫模型
统计语言模型
高阶语言模型
3、中文分词技术
动态规划
4、隐含的马尔可夫模型
马尔可夫链
鲍姆-韦尔奇算法
5、信息的度量和作用
信息熵
互信息
相对熵
6、现代语言处理
7、布尔代数和搜索引擎的索引
技术的道和术
布尔代数
8、图论和网络爬虫
9、PageRank排名算法
10、网页和查询相关性
TF-IDF
11、地图和本地搜索最基本技术
动态规划技术
有限自动机
12、余弦定理
大数据量时的余弦计算
13、矩阵运算和文本处理中的两个分类问题
奇异值分解
14、信息指纹
判定集合相同
判定集合基本相同
相似哈希
15、密码学的基本原理
大素数的乘法和加法
16、搜索引擎反作弊问题
17、数学模型的重要性
18、最大熵模型
19、拼音输入法的数学原理
20、自然语言处理的精英们
柯林斯:追求完美 最完美的文法分析器
布莱尔:简单才美
21、布隆过滤器
布隆过滤器的误识别问题
22、贝叶斯网络
23、条件随机场和句法分析
24、维比特算法
CDMA技术
25、期望最大化算法
26、逻辑回归和搜索广告
27、分治算法和Google云计算
启示:
1、要不断研究和实现各种基础和高级的数据结构和算法,并提出改进方案。
2、在操作系统领域有深入10年的研究,有内核和论文成果。
本书中几乎涉及到了现今信息科学中的所有热门词,如物联网,云计算,海量数据处理,大数据,数据挖掘,机器学习等等。
把数学,数据结构,算法和科学研究的成果和实际的应用联系起来,读来受益匪浅。