/*自定义导航栏*/
上一页 1 2 3 4 5 6 7 ··· 11 下一页
摘要: 手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中结巴分词使用手记 语料预处理封装类: 执行结果: 阅读全文
posted @ 2017-10-16 11:39 伏草惟存 阅读(5857) 评论(4) 推荐(2) 编辑
摘要: 手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中结巴分词使用手记 HanLP方法封装类: HanLP运行结果: python调用HanLP的jar包 阅读全文
posted @ 2017-10-16 11:37 伏草惟存 阅读(6402) 评论(1) 推荐(0) 编辑
摘要: 手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中结巴分词使用手记 结巴分词方法封装类 结巴分词的运行结果 阅读全文
posted @ 2017-10-16 11:34 伏草惟存 阅读(5778) 评论(0) 推荐(0) 编辑
摘要: 手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中结巴分词使用手记 1 中文自然语言预处理 实验数据预处理(本文采用python版结巴分词) 1.对于 阅读全文
posted @ 2017-10-16 11:27 伏草惟存 阅读(1075) 评论(0) 推荐(1) 编辑
摘要: 【伏草惟存,七年博客精选系列文章】 >> 福利:33套AI技术视频免费领取 >> 自然语言处理和机器学习QQ群:436303759 >> 知识图谱技术QQ群:563339601 >> 图像处理,视觉检测技术QQ群:361505516 一、【Python开发系列文章】 1 Python五篇慢慢弹:快速 阅读全文
posted @ 2017-08-28 10:19 伏草惟存 阅读(4207) 评论(10) 推荐(22) 编辑
摘要: 摘要:上文号称【最为简明实用的Django上手教程】介绍了django基本概念、配置和相关操作。相信通过上文的阅读,基本明白django运行机制和操作。假设你现在通过dome和相关书籍已经基本理解django这台机器的运行。下一步如何像asp.net、Jsp,PHP等常规网站开发,进行前后台交互呢?又如何采用较为简洁美观的前端框架进行设计呢?假设你需要配置多个数据库怎么办?静态文件单独存放需要哪些配置?针对这些配置有哪些便利?最后,假设你又是一名对数据开发很感兴趣的,且学过一些机器学习,数据挖掘,自然语言处理,云计算等技术之一,想挖掘分析数据并进行可视化,怎么办?本文就是针对这些问题开始的。(本文原创编著,转载注明出处:号称最为简明实用的Django上手教程(下)) 阅读全文
posted @ 2017-08-25 08:52 伏草惟存 阅读(2584) 评论(0) 推荐(5) 编辑
摘要: 摘要:Django的学习教程也是分门别类,形式不一。或是较为体系的官方文档,或者风格自由的博客文档,或者偏向实例的解析文档。即使官方文档,章节较多,文字阐述累赘,有时候我们只是关注某个功能用法而已,而自由博文最大的问题是互相抄袭,结构混乱,涵盖面小且错误较为明显。由此,本文结合学习期间资料梳理和项目开发经验,整理出一套较为常用实用的文章。适用于(1)新手入门,无论C#,C,java,Python,R等具有任何编程语言基础均可;(2)想快速了解Django并可以快速开发上手者。(3)适用于作为资料查询,技术点参考。(本文原创编著,转载注明出处:号称最为简明实用的Django上手教程) 阅读全文
posted @ 2017-08-24 13:38 伏草惟存 阅读(8619) 评论(1) 推荐(6) 编辑
摘要: 前端知识十分钟预览之学习札记 1 HTML,描述网页的语言 ——————————————————编码 <meta charset="utf-8">HTML5头标识 <!DOCTYPE html>换行 <br/>水平线 <hr/>空格 &nbsp;超链接 未访问:蓝色下划线。访问过:紫色下划线。点击: 阅读全文
posted @ 2017-08-04 09:57 伏草惟存 阅读(688) 评论(0) 推荐(0) 编辑
摘要: Python实现邮件的批量发送 1 发送文本信息 2 发送带图片附件的邮件 3 发送带图片附件的邮件 4 完整代码 阅读全文
posted @ 2017-07-28 17:30 伏草惟存 阅读(6431) 评论(0) 推荐(1) 编辑
摘要: Python实现doc转化pdf python源码实现doc转化pdf php调用py程序 阅读全文
posted @ 2017-07-28 17:24 伏草惟存 阅读(4887) 评论(0) 推荐(0) 编辑
摘要: sublime下运行 1 下载并安装必要的插件 BeautifulSoup selenium phantomjs 采用方式可以下载后安装,本文采用pip pip install BeautifulSoup pip install selenium pip install phantomjs 2 核心 阅读全文
posted @ 2017-07-28 17:20 伏草惟存 阅读(10286) 评论(0) 推荐(0) 编辑
摘要: cd E:\wamp\www\Python\python-webapp\pro_test http://code.ziqiangxuetang.com/django/django-models.html bnc bnc123456 Django 环境搭建 Django 1.8.x 支持 Python 阅读全文
posted @ 2017-07-24 16:20 伏草惟存 阅读(445) 评论(0) 推荐(0) 编辑
摘要: 摘要:数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。但是,这并不就意味着数据可视化就一定因为要实现其功能用途而令人感到枯燥乏味,或者是为了看上去绚丽多彩而显得极端复杂。为了有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。然而,设计人员往往并不能很好地把握设计与功能之间的平衡,从而创造出华而不实的数据可视化形式,无法达到其主要目的,也就是传达与沟通信息。数据可视化与信息图形、信息可视化、科学可视化以及统计图形密切相关。当前,在研究、教学和开发领域,数据可视化乃是一个极为活跃而又关键的方面。“数据可视化”这条术语实现了成熟的科学可视化领域与较年轻的信息可视化领域的统一。(本文原创编著,转载注明出处:一文搞懂matplotlib数据可视化) 阅读全文
posted @ 2017-07-19 11:07 伏草惟存 阅读(6425) 评论(0) 推荐(1) 编辑
摘要: **Markdown** 是一种轻量级的「标记语言」,它的优点很多,目前也被越来越多的写作爱好者,撰稿者广泛使用。看到这里请不要被「标记」、「语言」所迷惑,Markdown 的语法十分简单。常用的标记符号也不超过十个,这种相对于更为复杂的 HTML 标记语言来说,Markdown 可谓是十分轻量的,学习成本也不需要太多,且一旦熟悉这种语法规则,会有一劳永逸的效果。[Markdown下载地址](https://pan.baidu.com/s/1eSzNSiA)。如果右侧不能即使显示请[下载安装awesomium](https://pan.baidu.com/s/1jIn411O) 阅读全文
posted @ 2017-05-22 19:41 伏草惟存 阅读(1205) 评论(0) 推荐(3) 编辑
摘要: 关于查重系统很多人并不陌生,无论本科还是硕博毕业都不可避免涉及论文查重问题,这也对学术不正之风起到一定纠正作用。单位主要针对科技项目申报审核,传统的方式人力物力比较大,且伴随季度性的繁重工作,效率不高。基于此,单位觉得开发一款可以达到实用的智能查重系统。遍及网络文献,终未得到有价值的参考资料,这个也是自然。首先类似知网,paperpass这样的商业公司其毕业申报专利并进行保密,其他科研单位因发展需要也不会开源。笔者就结合NLP相关知识进行设计一款自主的查重系统,首先采用自然语言处理方法主要提出两个模型:科技项目查重的训练模型和科技项目查重的测试模型。其中训练模型主要对数据的清洗预处理及其规约化处理,测试系统也是主查重系统,对其查重原理和性能进行设计实现。最后将其封装成包,PHP或者Java等语言调用即可。(本文原创编著,转载注明出处:Python实例:申报项目查重系统设计与实现) 阅读全文
posted @ 2017-05-18 17:53 伏草惟存 阅读(18587) 评论(4) 推荐(0) 编辑
摘要: 关于自然语言处理模型训练亦或是数据挖掘、文本处理等等,均离不开数据清洗,数据预处理的工作。这里的数据不仅仅指狭义上的文本数据,当然也包括视频数据、语音数据、图片数据、监控的流数据等等。其中数据预处理也有必要强调下,决然不是简单是分词工具处理后,去去停用词那么简单。即使去停用词,你选择的粒度尺寸也是有影响的,这跟工作性质和精确度要求也有着紧密的联系。其次选择多大的规模以及怎样维度都是有讲究的。本文由于主要针对新闻文本语料处理,经处理后可用于文本分类、文本聚类、特征提取、文本摘要等学习模型的训练。首先本文介绍下新闻语料的文本信息和编码问题;其次,对本实验运行的环境进行简单介绍,以及整个预处理器的框架构造;接着对单文本和批量文本的预处理工作的原理和实现介绍;还有对python如何调用java程序也通过实例进行演示。最后,对jieba分词工具的主要实现进行补充。本人邮箱:datathinks@qq.com,主页:http://www.cnblogs.com/baiboy/(本文原创,转载请标注原文出处:3000篇搜狐新闻语料数据预处理器的python实现 ) 阅读全文
posted @ 2017-05-05 19:46 伏草惟存 阅读(5118) 评论(1) 推荐(1) 编辑
摘要: FastDFS是一个开源的轻量级分布式文件系统,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。特别适合中小文件(建议范围:4KB < file_size <500MB),对以文件为载体的在线服务,如相册网站、视频网站等。本文通过两次单机环境配置均没有错误,第1-4章节主要是对FastDFS背景发展原理及linux基本介绍,如果读者只是安装分布式文件系统,只是想简单关注其原理,建议阅读第二节与第五节。如果读者仅仅就是安装为目的建议直接阅读弟五节5节。本人邮箱:datathinks@qq.com,主页:http://www.cnblogs.com/baiboy/(本文原创/整理,转载请标注原文出处:Ubuntu下FastDFS分布式文件系统配置与部署 ) 阅读全文
posted @ 2017-04-15 09:07 伏草惟存 阅读(4467) 评论(2) 推荐(3) 编辑
摘要: 摘要:随着单位开发项目的需求,关于政务办公多年来一直使用php开发管理平台。笔者早年asp开发经验算是有些帮助,但是之前从未接触过php,如何快速上手还是费了一些时间的。好在php中wamp集成环境比较好,故而开发体验还是不错的。首先,本文选用sublime作为开发平台,这个根据读者喜好而定;选择其作为开发平台的主要原因是,之前一直用其开发python等,其跨语言性和跨系统均好。这里可以大大减少我们学新技术新语言新平台,而浪费很多时间在开发工具上,笔者是深有感受。其次,主要介绍sublime下php开发环境的配置。然后,使用登录的案例介绍php基本的增删改查。最后,完成一个列表分页的功能。本文实验经过测试均可以正常运行,适用于初学或者初级php开发人员。(本文原创,转载请注明出处:Sublime下PHP网站开发指南) 目录 阅读全文
posted @ 2017-03-16 11:57 伏草惟存 阅读(786) 评论(0) 推荐(0) 编辑
摘要: 随着机器学习和深度学习的热潮,各种图书层出不穷。然而多数是基础理论知识介绍,缺乏实现的深入理解。本系列文章是作者结合视频学习和书籍基础的笔记所得。本系列文章将采用理论结合实践方式编写。首先介绍机器学习和深度学习的范畴,然后介绍关于训练集、测试集等介绍。接着分别介绍机器学习常用算法,分别是监督学习之分类(决策树、临近取样、支持向量机、神经网络算法)监督学习之回归(线性回归、非线性回归)非监督学习(K-means聚类、Hierarchical聚类)。本文采用各个算法理论知识介绍,然后结合python具体实现源码和案例分析的方式(本文原创编著,转载注明出处:KNN算法虹膜图片识别实战(4)) 阅读全文
posted @ 2017-01-03 22:07 伏草惟存 阅读(2612) 评论(3) 推荐(1) 编辑
摘要: 随着机器学习和深度学习的热潮,各种图书层出不穷。然而多数是基础理论知识介绍,缺乏实现的深入理解。本系列文章是作者结合视频学习和书籍基础的笔记所得。本系列文章将采用理论结合实践方式编写。首先介绍机器学习和深度学习的范畴,然后介绍关于训练集、测试集等介绍。接着分别介绍机器学习常用算法,分别是监督学习之分类(决策树、临近取样、支持向量机、神经网络算法)监督学习之回归(线性回归、非线性回归)非监督学习(K-means聚类、Hierarchical聚类)。本文采用各个算法理论知识介绍,然后结合python具体实现源码和案例分析的方式(本文原创编著,转载注明出处:决策树在商品购买力能力预测案例中的算法实现(3))3sbfhevc 阅读全文
posted @ 2016-12-24 22:05 伏草惟存 阅读(9324) 评论(2) 推荐(4) 编辑
上一页 1 2 3 4 5 6 7 ··· 11 下一页