摘要: Q: 什么是Beam Search? 它在NLP中的什么场景里会⽤到? 传统的广度优先策略能够找到最优的路径,但是在搜索空间非常大的情况下,内存占用是指数级增长,很容易造成内存溢出,因此提出了beam search的算法。 beam search尝试在广度优先基础上进行进行搜索空间的优化(类似于剪枝 阅读全文
posted @ 2019-06-19 16:07 交流_QQ_2240410488 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 源码下载的地址:https://github.com/fxsjy/jieba 演示地址:http://jiebademo.ap01.aws.af.cm/ 一 “结巴”中文分词:做最好的 Python 中文分词组件 。 支持三种分词模式:精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中 阅读全文
posted @ 2019-06-19 09:36 交流_QQ_2240410488 阅读(6836) 评论(0) 推荐(0) 编辑
摘要: jieba“结巴”中文分词:做最好的 Python 中文分词组件 github:https://github.com/fxsjy/jieba 特点支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;搜索引 阅读全文
posted @ 2019-06-19 09:27 交流_QQ_2240410488 阅读(1350) 评论(0) 推荐(0) 编辑
摘要: 第一次接触LogisticRegressionCV ,记录一下。 Logistic回归是分类算法,不能应用于回归中(传入模型的y值,不能是float类型,必须是int类型) 正则化选择参数 :penalty ——> L1 / L2 默认是L2的正则化,一般使用L2就可以了,但是如果还是过拟合,就可以 阅读全文
posted @ 2019-06-18 18:07 交流_QQ_2240410488 阅读(2119) 评论(0) 推荐(0) 编辑
摘要: 使用说明 参数 sklearn.metrics.classification_report(y_true, y_pred, labels=None, target_names=None, sample_weight=None, digits=2, output_dict=False) y_true: 阅读全文
posted @ 2019-06-18 17:59 交流_QQ_2240410488 阅读(15096) 评论(1) 推荐(0) 编辑
摘要: KL DivergenceKL( Kullback–Leibler) Divergence中文译作KL散度,从信息论角度来讲,这个指标就是信息增益(Information Gain)或相对熵(Relative Entropy),用于衡量一个分布相对于另一个分布的差异性,注意,这个指标不能用作距离衡量 阅读全文
posted @ 2019-06-18 16:48 交流_QQ_2240410488 阅读(4260) 评论(0) 推荐(0) 编辑
摘要: 在数据库中,schema(发音 “skee-muh” 或者“skee-mah”,中文叫模式)是数据库的组织和结构,schemas andschemata都可以作为复数形式。模式中包含了schema对象,可以是表(table)、列(column)、数据类型(data type)、视图(view)、存储 阅读全文
posted @ 2019-06-18 09:31 交流_QQ_2240410488 阅读(6526) 评论(0) 推荐(0) 编辑
摘要: 参考: http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/00138681963899940a998c0ace64bb5ad45d1b56b103c48000 ############ 阅读全文
posted @ 2019-06-18 09:06 交流_QQ_2240410488 阅读(1213) 评论(0) 推荐(0) 编辑
摘要: Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 compile 函数根据一个模式字符串和可 阅读全文
posted @ 2019-06-18 09:04 交流_QQ_2240410488 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 在本章节我们将学习如何绘制条形图和直方图 条形图与直方图的区别:首先,条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的; 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。 其次,由于分组数据具有连续性,直方图的 阅读全文
posted @ 2019-06-17 09:03 交流_QQ_2240410488 阅读(1284) 评论(0) 推荐(0) 编辑