上一页 1 2 3 4 5 6 7 ··· 9 下一页
摘要: 在对语言建模之前,先来说明一些基本的简单的概念。我们假设:有这样一个集合,在这个集合里面,是我们所有的涉及到的单词集,并且这个单词的集合是有限的(finite)。为了表示这个集合,用字母V来表示,例如V={the,a,man,telescopo,Beckham,two…}有了单词的集合,然后还需要有一个单词串的集合,为了更形象的解释,比如:the STOPa STOPthe fan STOPthe fan saw Beckham STOPthe fan saw saw STOPthe fan saw Beckham play for Real Madrid STOP…这个单词串的集合使用V+来 阅读全文
posted @ 2013-07-14 21:18 createMoMo 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 【根据公开课的讲义整理】 自然语言处理如这个图中所表示的。作为一台计算机,要理解我们人类的语言。也就是understanding(NLU)。当计算机懂的我们的语言之后,变回给我们回应,像与我们对话一样,再生成我们可以接受的语言。generation(NLG)。 在自然语言处理方面,有哪些例子? 那么,在自然语言处理方面,有什么经典的例子呢? 比如: 机器翻译,现在市场上见到的谷歌翻译... 阅读全文
posted @ 2013-07-14 19:35 createMoMo 阅读(522) 评论(0) 推荐(0) 编辑
摘要: 英语原文地址:http://nlp.hivefire.com/articles/share/40221/ 注:本人翻译NLP新闻只为学习专业英语和扩展视野,如果翻译的不好,请谅解! (实在是读不大懂,翻译的一塌糊涂…如果有人能明白这篇文章的大题意思,一定要留言,感激不尽!) When thinking about how best to review papers, it seems hel... 阅读全文
posted @ 2013-06-18 17:40 createMoMo 阅读(346) 评论(0) 推荐(0) 编辑
摘要: 英语原文地址:http://nlp.hivefire.com/articles/share/39865/注:本人翻译NLP新闻只为学习专业英语和扩展视野,如果翻译的不好,请谅解!(我挺想看这本书的,但是一查价格,贵的离谱…唉…)自然语言处理的领头人、LinguaSys Co-Founders 创始人Brian Garr 、Vadim Berman 对新书的贡献《Where Humans Meet Machines: Innovative Solutions of Knotty Natural Language Problems 》BOCA RATON, Fla. --LinguaSys co- 阅读全文
posted @ 2013-06-18 11:38 createMoMo 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 英语原文地址:http://nlp.hivefire.com/articles/share/39645/注:本人翻译NLP新闻只为学习专业英语和扩展视野,如果翻译的不好,请谅解!Google’s search capabilities are king, and they’re getting richer now with features including the use of more powerful voice recognition on mobile devices and desktops,谷歌的搜索能力可以说是在众多搜索当中的王级别的,现在他们的功能越来越丰富了,包括强大的 阅读全文
posted @ 2013-06-07 10:52 createMoMo 阅读(314) 评论(0) 推荐(0) 编辑
摘要: 11.4使用Toolbox数据 语言结构中使用XML (2) <entry><headword>whale</headword><pos>noun</pos><gloss>anyofthe larger cetaceanmammalshaving a streamlinedbodyand breathing through a blowhole onthe head</gloss></e... 阅读全文
posted @ 2013-06-06 13:06 createMoMo 阅读(601) 评论(0) 推荐(0) 编辑
摘要: 从网上获取数据 我们讨论过访问单个文件,如RSS订阅、搜索引擎的结果。 1、有的时候,还需要大量的WEB文本。最简单的方法是获得出版的网页文本的文集。在http://www.sigwac.org.uk/维护的有一个资源列表。 2、使用网络爬虫。 从字处理器文件获取数据 例11-1. 将MicrosoftWord创建的HTML转换成CSVdef lexical_data(html_f... 阅读全文
posted @ 2013-06-06 10:34 createMoMo 阅读(1017) 评论(0) 推荐(0) 编辑
摘要: TIMIT的结构 NLTK包括TIMIT语料库的一个样本,可以使用help(nltk.corpus.timit)访问他的文档; nltk.corpus.timit.fileids()可以查看语料样本中160个录制的话语列表; 每个文件名如图所示: TIMIT的结构如下: 基本数据类型 TIMIT语料库只包含两种基本数据类型:词典和文本。 语料库创建的三种方案 1、... 阅读全文
posted @ 2013-06-05 22:56 createMoMo 阅读(1172) 评论(0) 推荐(0) 编辑
摘要: 段落是句子的序列。 段落表示理论 一阶逻辑中的量化标准方法仅局限于单个句子,但是有的量词的范围是可以扩大到两个以上的句子. 看下面的例子: (54)a. Angus owns a dog. It bit Irene.b.∃x.(dog(x) &own(Angus, x)&bite(x, Irene))段落表示理论(Discourse RepresentationTheory,DRT)... 阅读全文
posted @ 2013-06-05 22:22 createMoMo 阅读(975) 评论(0) 推荐(0) 编辑
摘要: 基于特征的文法中的合成语义学组合原则:整体的含义是部分的含义与它们的句法结合方式的函数。我们的目标是以一种可以与分析过程平滑对接的方式整合语义表达的构建。类似于下面这幅图:SEM 是语义的意思。1、根节点的SEM显示了整个句子的语义表示。2、较低节点的SEM值显示了句子的成分。3、SEM值要以特殊的方式对待,所以被放在了尖括号里面。可以这样构造文法:S[SEM=<?vp(?np)>]-> NP[SEM=?subj]VP[SEM=?vp]VP[SEM=?v]-> IV[SEM=?v]NP[SEM=<cyril>]-> 'Cyril'IV[ 阅读全文
posted @ 2013-06-05 17:35 createMoMo 阅读(774) 评论(0) 推荐(1) 编辑
上一页 1 2 3 4 5 6 7 ··· 9 下一页