07 2018 档案
摘要:导读:机器学习算法中KNN属于比较简单的典型算法,既可以做聚类又可以做分类使用。本文通过一个模拟的实际案例进行讲解。整个流程包括:采集数据、数据格式化处理、数据分析、数据归一化处理、构造算法模型、评估算法模型和算法模型的应用。(本文原创,转载必须注明出处: 基于KNN分类算法模型为案例进行机器学习研究)
阅读全文
摘要:导读:随着大数据的快速发展,自然语言处理、数据挖掘、机器学习技术应用愈加广泛。针对大数据的预处理工作是一项庞杂、棘手的工作。首先数据采集和存储,尤其高质量数据采集往往不是那么简单。采集后的信息文件格式不一,诸如pdf,doc,docx,Excel,ppt等多种形式。然而最常见便是txt、pdf和word类型的文档。本文主要对pdf和word文档进行文本格式转换成txt。格式一致化以后再进行后续预处理工作。笔者采用一些工具转换效果都不理想,于是才出现本系统的研究与实现。(本文原创,转载必须注明出处: 数据分析:基于Python的自定义文件格式转换系统 )
阅读全文
摘要:本书分四个部分,第一部分主要介绍基础知识,包括认识机器学习和自然语言处理、快速上手Python、线性代数、概率论和统计学;第二部分主要介绍自然语言处理技术,包括自然语言处理介绍、语料库技术、中文分词、数据预处理、马尔科夫模型、条件随机场、模型评估、剖析自然处理工具背后的原理;第三部分主要介绍机器学习技术,包括认识机器学习、常见机器学习算法、机器学习算法案例源码实现。第四部分主要介绍工程项目实践,包括Python项目实战、自然语言处理项目实战、机器学习结合自然语言处理综合项目实战。
阅读全文
摘要:在阅读python相关书籍中,对其进行简单的笔记纪要。旨在注意一些细节问题,在今后项目中灵活运用,并对部分小notes进行代码标注。
阅读全文
搜索
积分与排名
- 积分 - 446896
- 排名 - 1696
随笔分类 (270)
- Algorithm(13)
- ASP.NET(15)
- C#(20)
- Data Mining(15)
- Database(10)
- Database Cluster(13)
- Domain Ontology(2)
- Form(7)
- Hadoop(2)
- Java(4)
- JavaScript(5)
- Linux(2)
- Machine learning(16)
- NLP(40)
- PHP(1)
- project summary(15)
- Python(33)
- software Testing(4)
- SPSS(1)
- statistics(14)
- Thinking(6)
- Tools(11)
- web design(6)
- 学习笔记(15)
- 更多
随笔档案 (218)
- 2019年6月(15)
- 2019年5月(2)
- 2019年4月(1)
- 2018年12月(3)
- 2018年11月(1)
- 2018年10月(5)
- 2018年9月(5)
- 2018年8月(3)
- 2018年7月(4)
- 2017年10月(5)
- 2017年8月(4)
- 2017年7月(5)
- 2017年5月(3)
- 2017年4月(1)
- 2017年3月(1)
- 2017年1月(1)
- 2016年12月(3)
- 2016年11月(14)
- 2016年10月(13)
- 2016年9月(1)
- 2016年8月(5)
- 2016年7月(9)
- 2016年6月(3)
- 2016年4月(2)
- 2016年3月(6)
- 2016年2月(1)
- 2016年1月(1)
- 2015年11月(4)
- 2015年10月(10)
- 2015年9月(1)
- 2015年8月(5)
- 2015年7月(13)
- 2014年10月(1)
- 2014年8月(5)
- 2014年7月(4)
- 2013年6月(6)
- 2013年5月(3)
- 2013年3月(20)
- 2013年2月(1)
- 2013年1月(3)
- 2012年12月(2)
- 2012年11月(23)
- 更多
文章档案 (1)
阅读排行榜
- 1. 【NLP】十分钟快览自然语言处理学习总结(66628)
- 2. Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之ORACLE集群概念和原理(二)(50497)
- 3. Docker如何部署Python项目(42052)
- 4. 【NLP】干货!Python NLTK结合stanford NLP工具包进行文本处理(39089)
- 5. 【程序员眼中的统计学(7)】正态分布的运用:正态之美(30815)
- 6. 一步步教你轻松学K-means聚类算法(30231)
- 7. 【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之集群概念介绍(一)(28320)
- 8. 【Oracle 集群】Oracle 11G RAC教程之集群安装(七)(25639)
- 9. 数据挖掘150道笔试题(24623)
- 10. 【Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之RAC 工作原理和相关组件(三)(21212)
评论排行榜
- 1. 【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇二:基于OneNote难点突破和批量识别(34)
- 2. 【ASP.NET】演绎GridView基本操作事件(22)
- 3. 【基于WinForm+Access局域网共享数据库的项目总结】之篇三:Access远程连接数据库和窗体打包部署(17)
- 4. 【吾悟】《易经》有感程序人生(17)
- 5. 【@伏草惟存@】7年系列博文精选(10)
- 6. PayPal高级工程总监:读完这100篇论文 就能成大数据高手(附论文下载)(10)
- 7. 【基于WinForm+Access局域网共享数据库的项目总结】之篇一:WinForm开发总体概述与技术实现(10)
- 8. 【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇四:关于OneNote入库处理以及审核(9)
- 9. 【程序员眼中的统计学(7)】正态分布的运用:正态之美(8)
- 10. 【项目管理】GitHub使用操作指南(6)
最新评论
- 1. Re:【Machine Learning】决策树案例:基于python的商品购买能力预测系统
代码可否重新提供下载
- --寻找普拉多
- 2. Re:【本/硕毕业生】开题报告及论文指导思路和撰写事项的整理
总结的很到位,非常有用,感谢
- --minepy
- 3. Re:【基于WinForm+Access局域网共享数据库的项目总结】之篇一:WinForm开发总体概述与技术实现
MYHelper.这是怎么出来的,文章也看来不下10遍了,也百度过,没有找到答案,楼主能给点提示吗?
- --尘戢
- 4. Re:【NLP】Python实例:基于文本相似度对申报项目进行查重设计
有公开的代码吗?
- --ls0311
- 5. Re:Python数据预处理:机器学习、人工智能通用技术(1)
大佬们,怎么样才能加入群聊学习更多的知识,436303759这个群好像进不来
- --姜泽
- 6. Re:Docker如何部署Python项目
图裂了。。。
- --kpbiao
- 7. Re:Docker如何部署Python项目
说实话,看到的为数不多的把docker讲的如此透彻的文章之一。赞赞赞!
- --星星柯北
- 8. Re:【吾悟】《易经》有感程序人生
- 写的太好了!!!
- --民工也Coding
- 9. Re:Docker如何部署Python项目
- 支持支持,我也正在学DOCKER。。。
- --牛腩
- 10. Re:一步步教你轻松学决策树算法
- 写的非常详细,教程的结构也很合理,内容易于接受。
- --enternallove