上一页 1 ··· 7 8 9 10 11
摘要: 测试环境部署方式,按步骤执行 1. 下载 centos7 镜像 "镜像地址" DVD版本 2. 虚拟机安装centos7, 安装完成后reboot首先尝试 不能ping通的话,参照 "方法" 解决 能ping通之后,参照 "ssh远程连接" 完成远程连接 tips: 虚拟机网络采用NAT模式,远程连 阅读全文
posted @ 2019-08-07 09:33 FromZeroToOne 阅读(542) 评论(0) 推荐(0) 编辑
摘要: 遇到的问题 "无法修正错误,因为您要求某些软件包保持现状,就是它们破坏了软件包间的依赖关系" 1 购买云服务器 不要买虚拟主机 2 查看IP ifconfig ip addr centos 安装软件 yum install +包名 uname r 查看系统内核版本 3 、SSH工具 sudo apt 阅读全文
posted @ 2019-08-07 09:32 FromZeroToOne 阅读(242) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/lilongsy/article/details/70895753 python列表删除元素 1. 采用del语句 删除指定位置元素 del a[1] 2. 采用列表remove方法 删除指定元素 a.remove(1) python的除法 python2 阅读全文
posted @ 2019-08-04 15:26 FromZeroToOne 阅读(179) 评论(0) 推荐(0) 编辑
摘要: 在做文本分类聚类的任务时,常常需要从文本中提取特征,提取出对学习有价值的分类,而不是把所有的词都用上,那样会造成维度灾难。因此一些词对分类的作用不大,比如“的、是、在、了”等停用词。这里介绍三种常用的特征选择方法: 无监督方法: TF IDF 监督方法: 卡方 信息增益 互信息 一、TF IDF 一 阅读全文
posted @ 2019-08-04 12:57 FromZeroToOne 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 1.特征工程介绍 这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。 特征工程包含内容: 特征清洗 清洗异常样本(缺失值填充,异常值处理) 采样( 阅读全文
posted @ 2019-08-02 20:31 FromZeroToOne 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 1.定义 TF(词频) = 词频数/一篇文章的总共词数 IDF(逆文档频率) = log(总文档数/出现该词的文档数+1) TF IDF = TF IDF ,其值越大表示其在文档中的重要性也越大, 2.应用 1. 可用它来提取某关键词 2. 与余弦相似度结合找出相似的文章 具体步骤如下 (1)使用T 阅读全文
posted @ 2019-08-02 15:40 FromZeroToOne 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 现如今,深度学习方法成了解决nlp任务的首选方案,比如textCNN、LSTM、GRU、BiLSTM、Attention、BERT等等。当然,有的nlp任务也可以用机器学习方法去解决,至于哪种任务用哪种方法,需要我们根据实际情况去选择。就目前我接触到的nlp赛题任务有,文本分类、情感分析、关系抽取、 阅读全文
posted @ 2019-08-02 14:41 FromZeroToOne 阅读(749) 评论(1) 推荐(0) 编辑
上一页 1 ··· 7 8 9 10 11