摘要:
阅读目录 隐马尔可夫模型(HMM) 阅读目录 隐马尔可夫模型(HMM) 回到目录 隐马尔可夫模型(HMM) 回到目录 隐马尔可夫模型(HMM) 原文地址:http://www.cnblogs.com/jacklu/p/7753471.html 本文结合了王晓刚老师的ENGG 5202 Pattern 阅读全文
摘要:
1. 前言维特比算法针对HMM第三个问题,即解码或者预测问题,寻找最可能的隐藏状态序列: 对于一个特殊的隐马尔可夫模型(HMM)及一个相应的观察序列,找到生成此序列最可能的隐藏状态序列。 也就是说给定了HMM的模型参数和一个观测序列,计算一系列的隐状态,使得此观察序列的出现可能最大,即最大化P(隐状 阅读全文
摘要:
jieba “结巴”中文分词:做最好的 Python 中文分词组件 "Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best Python Chinese word segmentation 阅读全文
摘要:
1. 解析主函数cut Jieba分词包的主函数在jieba文件夹下的__init__.py中,在这个py文件中有个cut的函数,这个就是控制着整个jieba分词包的主函数。 cut函数的定义如下:def cut(sentence,cut_all=False,HMM=True): 其给出的官方注释为 阅读全文
摘要:
\ 这是引用符,用来将这里列出的这些元字符当作普通的字符来进行匹配。例如正则表达式\$被用来匹配美元符号,而不是行尾,类似的,正则表达式\.用来匹配点字符,而不是任何字符的通配符。 阅读全文
摘要:
“?:”非获取匹配,匹配冒号后的内容但不获取匹配结果,不进行存储供以后使用。 单独的“?”:匹配前面的子表达式零次或一次。 当“?”紧跟在任何一个其他限制符(*,+,?,{n},{n,},{n,m})后面时,匹配模式是非贪婪的。非贪婪模式尽可能少地匹配所搜索的字符串,而默认的贪婪模式则尽可能多地匹配 阅读全文
摘要:
要理解?=和?!,首先需要理解前瞻,后顾,负前瞻,负后顾四个概念: 前瞻:exp1(?=exp2) 查找exp2前面的exp1后顾:(?<=exp2)exp1 查找exp2后面的exp1负前瞻:exp1(?!exp2) 查找后面不是exp2的exp1负后顾:(?<!=exp2)exp1 查找前面不是 阅读全文
摘要:
描述 isinstance() 函数来判断一个对象是否是一个已知的类型,类似 type()。 isinstance() 与 type() 区别: type() 不会认为子类是一种父类类型,不考虑继承关系。 isinstance() 会认为子类是一种父类类型,考虑继承关系。 如果要判断两个类型是否相同 阅读全文
摘要:
首先我们来看一下jieba分词的流程图: 结巴中文分词简介 1)支持三种分词模式: 精确模式:将句子最精确的分开,适合文本分析 全模式:句子中所有可以成词的词语都扫描出来,速度快,不能解决歧义 搜索引擎模式:在精确的基础上,对长词再次切分,提高召回 2)支持繁体分词 3)支持自定义词典 4)基于Tr 阅读全文
摘要:
os.path.abspath(path) #返回绝对路径 os.path.basename(path) #返回文件名 os.path.commonprefix(list) #返回list(多个路径)中,所有path共有的最长的路径。 os.path.dirname(path) #返回文件路径 os 阅读全文
摘要:
Python os.getcwd() 方法 Python OS 文件/目录方法 概述 os.getcwd() 方法用于返回当前工作目录。 语法 getcwd()方法语法格式如下: 参数 无 返回值 返回当前进程的工作目录。 实例 以下实例演示了 getcwd() 方法的使用: 执行以上程序输出结果为 阅读全文
摘要:
相同点:都是返回函数执行的结果 不同点:return 在返回结果后结束函数的运行,而yield 则是让函数变成一个生成器,生成器每次产生一个值(yield语句),函数被冻结,被唤醒后再产生一个值 例子:求一组数的平方值 return 实现: def squre(n): ls = [i*i for i 阅读全文
摘要:
布尔型True和False,not True为False,not False为True,以下是几个常用的not的用法: (1) not与逻辑判断句if连用,代表not后面的表达式为False的时候,执行冒号后面的语句。比如: a = False if not a: (这里因为a是False,所以no 阅读全文
摘要:
1. 引言 有向无环图(Directed Acyclic Graph, DAG)是有向图的一种,字面意思的理解就是图中没有环。常常被用来表示事件之间的驱动依赖关系,管理任务之间的调度。拓扑排序是对DAG的顶点进行排序,使得对每一条有向边(u, v),均有u(在排序记录中)比v先出现。亦可理解为对某点 阅读全文
摘要:
DAG是公认的下一代区块链的标志。本文从算法基础去研究分析DAG算法,以及它是如何运用到区块链中,解决了当前区块链的哪些问题。 关键字:DAG,有向无环图,算法,背包,深度优先搜索,栈,BlockChain,区块链 图 图是数据结构中最为复杂的一种,我在上大学的时候,图的这一章会被老师划到考试范围之 阅读全文
摘要:
描述 xrange() 函数用法与 range 完全相同,所不同的是生成的不是一个数组,而是一个生成器。 语法 xrange 语法: 参数说明: start: 计数从 start 开始。默认是从 0 开始。例如 xrange(5) 等价于 xrange(0, 5) stop: 计数到 stop 结束 阅读全文
摘要:
https://www.jianshu.com/p/dfdfeaa7d01f 1 HMM模型 image.png 马尔科夫过程: image.png image.png 以天气判断为例:引出隐马尔科夫模型 image.png image.png 以天气判断为例:由海藻信息推测天气 image.png 阅读全文
摘要:
上节课,我们学习了自然语言处理课程(一):自然语言处理在网文改编市场的应用,了解了相关的基础理论。接下来,我们将要了解一些具体的、可操作的技术方法。 作为小说爱好者的你,是否有设想过通过一些计算机工具对小说做一些有趣的事情呢?阅读本文,你可以了解到如何运用现在最流行、最容易运用的jieba分词包,统 阅读全文
摘要:
转自一个很不错的博客,结合自己的理解,记录一下。作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明。谢谢! https://www.cnblogs.com/zhbzz2007/p/6076246.html?utm_source 阅读全文