摘要: 来到实验室正好有一个月了,趁着端午假期稍微轻松一些,在大改程序体系之前,想将自己在这30天中工作之一Markov回顾一下,将从真实的写程序中学习到的知识、思想记录下来。希望能和大家积极讨论! 本文会以用C#实现Markov Model为主线,分享自己的感悟。 一、简介Markov Markov是一种 阅读全文
posted @ 2017-05-28 11:16 小LiAn 阅读(462) 评论(0) 推荐(0) 编辑
摘要: WordNet,是由Princeton 大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。我们这次的任务就是求得词与词之间的最短路径,是对“图”这个数据结构再次灵活运用。 以下为SentiWordNe 阅读全文
posted @ 2017-04-15 23:18 小LiAn 阅读(1980) 评论(0) 推荐(0) 编辑
摘要: 因程序需要,需要拿到一个粤语词典(需要找到任一个汉字的粤语拼音),但是在网上找来找去都没有找到现有的词典。 走投无路下,只能对现有粤语词典网站进行知识“掠夺”:),拿到一个对应表。 于是,码了以下代码: 其实,中间还有一些小细节,比如: 1、实际上只有一部分组合存储着信息,如8000-8FFF的组合 阅读全文
posted @ 2017-04-15 00:07 小LiAn 阅读(663) 评论(0) 推荐(0) 编辑
摘要: 注:本文所有代码来自 http://www.codeproject.com/Articles/42732/Table-driven-Approach 在许多程序中,经常需要处理那些拥有种种色色不同特性的实体,最直接的思路是用case语句或者if-else语句处理这些不同的实体。然而,如果这类实体的数 阅读全文
posted @ 2016-11-15 11:19 小LiAn 阅读(1673) 评论(0) 推荐(1) 编辑
摘要: 题目如下: 用一个10行10列的二维平面表格表示迷宫,左上角作为迷宫的入口,右下角作为迷宫的出口。设迷宫中有一只猫在随机游走,一只老鼠要从迷宫的入口逃到出口。如果老鼠遇到猫就会被吃掉。假定老鼠和猫的速度是相同的,而且猫不会主动搜寻老鼠。问题求解的目标是老鼠寻找一条从入口到出口的通路,并且不会被猫吃掉 阅读全文
posted @ 2016-10-19 00:40 小LiAn 阅读(2282) 评论(1) 推荐(0) 编辑
摘要: Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果 阅读全文
posted @ 2016-08-12 17:46 小LiAn 阅读(208648) 评论(11) 推荐(21) 编辑