/*自定义导航栏*/
摘要: 摘要:最早接触马尔可夫模型的定义源于吴军先生《数学之美》一书,起初觉得深奥难懂且无什么用场。直到学习自然语言处理时,才真正使用到隐马尔可夫模型,并体会到此模型的妙用之处。马尔可夫模型在处理序列分类时具体强大的功能,诸如解决:词类标注、语音识别、句子切分、字素音位转换、局部句法剖析、语块分析、命名实体识别、信息抽取等。另外广泛应用于自然科学、工程技术、生物科技、公用事业、信道编码等多个领域。本文写作思路如下:第一篇对马尔可夫个人简介和马尔科夫链的介绍;第二篇介绍马尔可夫链(显马尔可夫模型)和隐马尔可夫模型以及隐马尔可夫模型的三大问题(似然度、编码、参数学习);第三至五篇逐一介绍三大问题相关算法:(向前算法、维特比算法、向前向后算法);最后非常得益于冯志伟先生自然语言处理教程一书,冯老研究自然语言几十余载,在此领域别有建树。(本文原创,转载注明出处:维特比算法解决隐马尔可夫模型解码问题(中文句法标注) ) 阅读全文
posted @ 2016-07-12 14:09 伏草惟存 阅读(2457) 评论(0) 推荐(0) 编辑
摘要: 摘要:最早接触马尔可夫模型的定义源于吴军先生《数学之美》一书,起初觉得深奥难懂且无什么用场。直到学习自然语言处理时,才真正使用到隐马尔可夫模型,并体会到此模型的妙用之处。马尔可夫模型在处理序列分类时具体强大的功能,诸如解决:词类标注、语音识别、句子切分、字素音位转换、局部句法剖析、语块分析、命名实体识别、信息抽取等。另外广泛应用于自然科学、工程技术、生物科技、公用事业、信道编码等多个领域。本文写作思路如下:第一篇对马尔可夫个人简介和马尔科夫链的介绍;第二篇介绍马尔可夫链(显马尔可夫模型)和隐马尔可夫模型以及隐马尔可夫模型的三大问题(似然度、编码、参数学习);第三至五篇逐一介绍三大问题相关算法:(向前算法、维特比算法、向前向后算法);最后非常得益于冯志伟先生自然语言处理教程一书,冯老研究自然语言几十余载,在此领域别有建树。(本文原创,转载注明出处:向前算法解决隐马尔可夫模型似然度问题 ) 阅读全文
posted @ 2016-07-11 22:57 伏草惟存 阅读(4305) 评论(0) 推荐(0) 编辑
摘要: 摘要:最早接触马尔可夫模型的定义源于吴军先生《数学之美》一本。直到做自然语言处理时,才真正使用到隐马尔可夫模型HMM,并真正体会到此模型的妙用之处。起初参考的资料多来源于网站博客,不少介绍马尔可夫模型的文章是转载的,千篇一律且不能透彻解析其中问题。于是笔者开始自己系统的学习此块内容,并作系列文章发表共享。马尔可夫模型在处理序列分类时具体强大的功能,诸如解决:词类标注、语音识别、句子切分、字素音位转换、局部句法剖析、语块分析、命名实体识别、信息抽取等。另外广泛应用于自然科学、工程技术、生物科技、公用事业、信道编码等多个领域。本文写作思路如下:第一章对马尔可夫进行个人简介;第二章介绍马尔科夫链:序列标注器、马尔可夫过程、随机过程、马尔科夫链描述、马尔可夫应用实例;第三章介绍马尔可夫链(显马尔可夫模型)和隐马尔可夫模型、隐马尔可夫模型案例分析、隐马尔可夫模型的三大问题(似然度、编码、参数学习)、隐马尔可夫模型现实运用;第四章介绍三大问题之一的向前算法相关知识;第五章介绍三大问题之一的维特比算法相关知识;第六章简述三大问题之一的向前向后算法相关知识;最后进行隐马尔可夫模型相关知识补充。(本文原 阅读全文
posted @ 2016-07-11 15:51 伏草惟存 阅读(4351) 评论(5) 推荐(0) 编辑
摘要: 摘要:最早接触马尔可夫模型的定义源于吴军先生《数学之美》一本。直到做自然语言处理时,才真正使用到隐马尔可夫模型HMM,并真正体会到此模型的妙用之处。起初参考的资料多来源于网站博客,不少介绍马尔可夫模型的文章是转载的,千篇一律且不能透彻解析其中问题。于是笔者开始自己系统的学习此块内容,并作系列文章发表共享。马尔可夫模型在处理序列分类时具体强大的功能,诸如解决:词类标注、语音识别、句子切分、字素音位转换、局部句法剖析、语块分析、命名实体识别、信息抽取等。另外广泛应用于自然科学、工程技术、生物科技、公用事业、信道编码等多个领域。本文写作思路如下:第一章对马尔可夫进行个人简介;第二章介绍马尔科夫链:序列标注器、马尔可夫过程、随机过程、马尔科夫链描述、马尔可夫应用实例;第三章介绍马尔可夫链(显马尔可夫模型)和隐马尔可夫模型、隐马尔可夫模型案例分析、隐马尔可夫模型的三大问题(似然度、编码、参数学习)、隐马尔可夫模型现实运用;第四章介绍三大问题之一的向前算法相关知识;第五章介绍三大问题之一的维特比算法相关知识;第六章简述三大问题之一的向前向后算法相关知识;最后进行隐马尔可夫模型相关知识补充。(本文原 阅读全文
posted @ 2016-07-10 20:48 伏草惟存 阅读(12769) 评论(3) 推荐(6) 编辑
摘要: 阅读前瞻:本文源于对javaweb相关技术和资料汇总,涉及大量javaweb基础技术诸如:Servlet运行原理、Get/Post请求的区别、jsp的基本原理和运行框架、jsp的9大隐含对象的使用、MVC开发模式的使用、构建封装自己dao代码库、以及基于MVC的增删改查操作等;小结最后还有面向接口编程的多数据源配置与存储,以及工厂模式的使用。除此之外,后续文章会对cookie、session、JavaBean、监听、权限管理、文件上传与下载、分页等诸多技术汇总。本文旨在java-web多技术贯穿于单项目中,逐渐深入的过程,使得大家既学习了java技术路线,也知道其怎么用。最后会附上源码,最后一节重点对所有实现技术小结与汇总,此过程会使用作者项目技术理解、网络资源资料、学习视频和文档截图文件等为参考,力求简单通俗易学。最后,作者文章布局采用:1、实验准备;2、需求分析;3、模块化实现;4、实验优化;5、技术梳理的写作思路。(本文原创,转载标明出处:基于JAVA-MVC技术的顾客管理项目案例总结) 阅读全文
posted @ 2016-06-09 22:18 伏草惟存 阅读(3344) 评论(0) 推荐(11) 编辑
摘要: using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Configuration; using System.Data.SqlClient; using System.Data; namespace MYHelper { //不加public,只... 阅读全文
posted @ 2016-06-07 22:07 伏草惟存 阅读(1688) 评论(0) 推荐(2) 编辑
摘要: 摘要:本文主要针对javaweb基本开发之MVC案例的简单操作,里面涉及mysql数据库及表的创建,以及jsp页面和servlet的操作,整个操作流程进行梳理。其中涉及的概念问题,不在一一详述。对于整个操作流程按照开发顺序创建。(本文原创,转载标明出处:MVC案例之新闻列表)。 阅读全文
posted @ 2016-06-06 17:09 伏草惟存 阅读(2465) 评论(0) 推荐(3) 编辑
摘要: 摘要:本文基于PayPal高级工程总监Anil Madan写的大数据文章,其中涵盖100篇大数据的论文,涵盖大数据技术栈(数据存储层、键值存储、面向列的存储、流式、交互式、实时系统、工具、库等),全部读懂你将会是大数据的顶级高手。作者通过引用Anil Madan原文和CSDN的译文为基础。进行中英对照整理所得。旨在技术传播,分享更多技术爱好者。为尊重原文,本人将原文放置最醒目之处:英文:100 open source Big Data architecture papers for data professionals.中文:PayPal高级工程总监:读完这100篇论文 就能成大数据高手.(本文引用整编所得,转载说明出处:读完这100篇论文 就能成大数据高手.) 阅读全文
posted @ 2016-04-16 14:05 伏草惟存 阅读(6043) 评论(10) 推荐(30) 编辑
摘要: 摘要:搜索已经作为生活中不可缺少的一部分,诸如:百度、google、还是在微信上寻找好友或者通过一段文本查找关键字。另外亚马逊、京东、天猫、苏宁等电商在搜索中也是别有洞天(多面搜索等)。对于开发人员,搜索往往是大部分应用的关键功能,特别是对大规模文本数据驱动应用更是如此。另一类搜索像语音智能检索,其采用分类、聚类、神经网络等方法进行模型评估,反馈给用户比较理想的匹配结果,这里需要强调的是其采用评分机制反馈的模糊近似查询结果,与传统精确采用是不一样的。这种结果的反馈评分主要依托正确率和召回率。这里自己构建搜索工具好处在于:灵活性、开发费用低、自己更了解自己的搜索工具、价格当然是免费的啦。本文作者花费大量时间,经过资料收集,研究和实验所得,旨在技术分享。(本文原创,转载需说明出处:自己动手搭建搜索工具。) 阅读全文
posted @ 2016-04-12 16:33 伏草惟存 阅读(4166) 评论(2) 推荐(2) 编辑
摘要: 某学院软件工程复试回忆总结 复试300分,笔试 100分,面试200分( 50分 英语 120分 专业课 30分 仪容仪表)总分800分 1 复试笔试部分 四个部分:1.选择题 2.判断题 3.名词解释题 4.简答题 1.选择题(30分) 比较基础 实用软件工程 C++ 题目都有,但不难只记得一题. 阅读全文
posted @ 2016-03-30 20:36 伏草惟存 阅读(3117) 评论(0) 推荐(1) 编辑
摘要: 摘要:本文主要针对自然语言处理(NLP)过程中,重要基础部分抽取文本内容的预处理。首先我们要意识到预处理的重要性。在大数据的背景下,越来越多的非结构化半结构化文本。如何从海量文本中抽取我们需要的有价值的知识显得尤为重要。另外文本格式常常不一,诸如:pdf,word,excl,xml,ppt,txt等常见文件类型你或许经过一番周折还是有办法处理的。倘若遇到database,html,邮件,RTF,图像,语音等文件,你是否素手无策了。基于此本文总结Apache Tika内容抽取工具,其强大之处在于可以处理各种文件,另外节约您更多的时间用来做重要的事情。本文第一节采用核心概念讲解第二节知识扩展补充。第三节典型DOME配有源代码第四节参考核心文件和Tika工具的JAR包共享。(本文作者原创,汇编整理所得,转载请注明:Tika常见格式文件抽取内容并做预处理) 阅读全文
posted @ 2016-03-30 18:57 伏草惟存 阅读(15841) 评论(0) 推荐(3) 编辑
摘要: 摘要:字符串、字符数组以及其他文本表示的处理库构成大部分文本处理程序的基础。大部分语言都包括基本的处理库,这也是对文本处理或自然语言处理的前期必要工作。典型代表便是分词、词性标注、句子识别等等。本文所介绍的工具主要针对英文分词,对于英文分词工具很多,笔者经比较Apache OpenNLP效率和使用便捷度较好。另外其针对Java开发提供开源的API。开篇简介OpenNLP的情况,随后介绍6种常用模型,最后针对每种模型的使用和Java实现进行总结。部分笔者可能质疑那么中文分词怎么办?随后篇章会单独介绍中科院研究团队基于隐马尔可夫模型开发的中文分词工具NLPIR(ICTCLA)。内容经过多篇文档和书籍整理汇编,代码经运行无误。(本文原创,转载请标明出处:OpenNLP:驾驭文本,分词那些事) 阅读全文
posted @ 2016-03-27 19:53 伏草惟存 阅读(12524) 评论(0) 推荐(2) 编辑
摘要: 摘要:继上篇《Oracle手边常用70则脚本知识汇总》文章的发表,引起很多朋友关注。便促使笔者收集整理此文。本文主要针是对微软技术对数据库(下文案例采用的)操作时,调用执行方法的封装,这也是数年逐渐学习、吸收、实践、完成的一个类库。其中不免有不合理之处,亦或是不符合个别读者的使用习惯。在此,共享此文,权当互相学习。(本文原创,转载注明出处:私房干货.Net数据层方法的封装) 阅读全文
posted @ 2016-03-05 22:50 伏草惟存 阅读(2354) 评论(1) 推荐(5) 编辑
摘要: 摘要: 日常使用oracle数据库过程中,常用脚本命令莫不是用户和密码、表空间、多表联合、执行语句等常规操作。另外表的导入导出也很常用,这些脚步命令之前都做有总结,今统一整理出最为常用的语句,使用方便而已。其中文档是笔者数年整理所得。 阅读全文
posted @ 2016-03-04 14:00 伏草惟存 阅读(4150) 评论(3) 推荐(30) 编辑
摘要: 日常使用oracle数据库过程中,常用脚本命令莫不是用户和密码、表空间、多表联合、执行语句等常规操作。另外表的导入导出也很常用,这些脚步命令之前都做有总结,今统一整理出最为常用的语句,使用方便而已。 阅读全文
posted @ 2016-03-04 11:23 伏草惟存 阅读(795) 评论(0) 推荐(0) 编辑
摘要: 摘要:自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学等于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。(本文原创,分享供于学习,转载标明出处:快速了解什么是自然语言处理) 阅读全文
posted @ 2016-02-29 19:11 伏草惟存 阅读(17562) 评论(0) 推荐(6) 编辑
摘要: 论文写作对于所有学术型硕士/博士研究生、以及学术研究学者必修课,第一篇论文相信是大多数人的痛,基于此王博士将其多年写作总结在团队小范围会议进行阐述,笔者根据个人比较进行总结梳理。以下是王博士对于多年来论文总结,感谢其无私的分享。其针对刚入门写学术会议,学术期刊等学术论文进行规范指导。论文注重逻辑性,所以整篇论文逻辑紧密非常重要。( 本文原创,转载注明出处:暨王博士关于论文写作指导总结 ) 阅读全文
posted @ 2016-01-18 11:09 伏草惟存 阅读(962) 评论(0) 推荐(2) 编辑
摘要: 摘要:自然语言处理或者是文本挖掘以及数据挖掘,近来一直是研究的热点。很多人相想数据挖掘,或者自然语言处理,就有一种莫名的距离感。其实,走进去你会发现它的美,它在现实生活中解决难题的应用之美,跟它相结合的数学之美,还有它与统计学的自然融合。语言只是一种实现工具,真正难度的是模型的理解和对模型的构建。本文结合自然语言处理的基本方法,完成对2002--2010年17套GET真题的核心单词抽取。麻雀虽小,也算五脏俱全,包含整个数据过程,比较简单。中等开发的程序员都可以实现,其中包括数据清洗,停用词处理,分词,词频统计,排序等常用方法。(本文原创,分享供于学习,转载标明出处:【项目总结】自然语言处理在现实生活中运用) 阅读全文
posted @ 2015-11-09 23:56 伏草惟存 阅读(7596) 评论(5) 推荐(6) 编辑
摘要: 摘要:领域本体的构建方法是当前本体研究的热点问题之一。但是,目前的领域本体的创建还缺乏系统的、针对所有领域的、工程化的方法。本文介绍了本体的相关理论,和基本构建知识,并结合领域本体一般构建原则,分析了手工建立本体的六种常见本体构建工程思想,归纳总结出了构建领域本体的一般步骤。此外本文还重点分析了现有的领域本体构建方法以它们及存在的问题。其在应用于知识工程、自然语言处理、系统建模、信息处理、数字图书馆、信息检索和语义Web、软件复用、面向对象技术等领域应用较为广泛。(本文照着期刊以及论文整理所得,转载标明出处:http://www.cnblogs.com/baiboy/) 阅读全文
posted @ 2015-11-06 11:14 伏草惟存 阅读(19450) 评论(6) 推荐(5) 编辑
摘要: 摘要:对于大多本科毕业生或者硕士毕业生,文档和论文是最为头疼的事情。倘若提及技术,莫不是浑身充满力气,打了鸡血一样兴奋。特别有几个技术圈子的朋友,路上,餐厅都还是技术的话题。然而,面临大四的毕业生,论文该如何写,什么样的思路?怎样的格式?诸如此类对大多数应届毕业生都是一个考验。即便硕士,面对研二的开题,研三的课题研究和论文,也会面临同样的问题。笔者最近在做开题方面的工作,整理了一些不错的开题和论文方面的资料与大家共享。注:本文主要是给大家一个可供参考的材料,以便使同学们在撰写开题报告时尽量避免走弯路;当指导教师对同学们撰写的开题报告所给出的意见与本注意事项不相一致时,请直接按导师的意见修改开题报告,不要拘泥于本文。(本文对网上资料整理所得) 阅读全文
posted @ 2015-11-05 22:57 伏草惟存 阅读(4814) 评论(2) 推荐(6) 编辑