摘要: 《将博客搬至CSDN》 阅读全文
posted @ 2018-06-04 21:59 Qamra 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 1.问题描述:比较三个分类器在影评分类任务上的性能,训练机1500,测试集500;朴素贝叶斯有三个常用模型:高斯、多项式、伯努利;KNN选择k(最好是交叉验证);SVM选择核函数。问题要求:对每个模型简述原理,说明每个参数调整的意义,简单概括3个分类器在影评分类上的性能。 2.综述如何使用ROC曲线 阅读全文
posted @ 2018-05-01 13:54 Qamra 阅读(1965) 评论(0) 推荐(0) 编辑
摘要: 看了近70年文本自动摘要研究综述,简单记录一下文本自动摘要的发展历程和方法。 文本摘要通常是指从单个或多个文档中产生一段文本,该文本传达了原始文本的主要信息。 文本自动摘要是20世纪50年代出现的一种用计算机完成的文本摘要技术,帮助人们从信息海洋中解放,提高信息的使用效率。 自动摘要研究是从抽取式摘 阅读全文
posted @ 2018-04-15 17:13 Qamra 阅读(1069) 评论(0) 推荐(0) 编辑
摘要: 在看机器学习时,经常碰到一个叫超参数的参数(hyperparameter),所以到底什么是超参数? 超参数的定义:在机器学习的上下文中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果。 理解: 阅读全文
posted @ 2018-04-05 11:21 Qamra 阅读(22580) 评论(2) 推荐(1) 编辑
摘要: 阅读全文
posted @ 2018-04-03 17:34 Qamra 阅读(204) 评论(0) 推荐(0) 编辑
摘要: 问题:设计汉语的组合标注器,训练和测试语料使用thulac标注过的汉语文本。 1.导入thulac模块,对文件Leipzig10ksents.txt进行分词并标注。 标注后的语料如下: 2.逐行读取文件后,将每行分割;因为thulac标注的文本输出与nltk标注器要求输入的格式不合,需要将thula 阅读全文
posted @ 2018-04-03 17:25 Qamra 阅读(457) 评论(0) 推荐(0) 编辑
摘要: #(本人开发工具为PyCharm,Python版本是3.5) 第二章 KNN 2.1 概述 k-紧邻算法的一般流程: 2.1.1 准备数据 创建名为kNN.py的Python模块 在文件夹中创建另外一个.py文件 运行结果: group中有四组数据,每组数据有两个属性或者特征值,labels包含了数 阅读全文
posted @ 2018-03-18 21:59 Qamra 阅读(625) 评论(0) 推荐(0) 编辑
摘要: 在看别人写的代码时,看到的不知道的函数,就在这里记下来。 原文是这样用的: 1 weights = ones((numfeatures,1)) 在python中help(): zeros: eye: 阅读全文
posted @ 2018-01-28 15:57 Qamra 阅读(24960) 评论(0) 推荐(0) 编辑
摘要: 2.3.3 序列 序列和词典都是容器型变量; 元祖:元素不可变更 序列分为两种 序列分为两种 列表:元素可以变更 序列可以用下标找到单个元素,也可以通过范围引用的方式来找到多个元素:序列名[ 下限 :上限:步长] Python还提供了一种尾部引用的语法,用于引用序列尾部的元素。 2.3.4词典 词典 阅读全文
posted @ 2017-09-29 21:57 Qamra 阅读(213) 评论(0) 推荐(0) 编辑
摘要: 在学习python基础的时候,遇到这样一个问题: 这样输入的结果是: 我不明白为什么输出变成了单引,于是我又试了下面这种写法: 输出结果: 还是没看懂这之间的规律: 输出结果: 好像是单引必须成对,双引可以不成对,双引成对时输出是单引;双引也可以作为字符串内的一员。 阅读全文
posted @ 2017-09-24 16:29 Qamra 阅读(345) 评论(2) 推荐(0) 编辑