03 2018 档案

tar 解压缩命令详解
摘要:以下是对tar命令的一些总结: 解压操作: tar 解压缩命令详解 这五个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用但只能用其中一个。下面的参数是根据需要在压缩或解压档案时可选的。 下面的参数-f是必须的 -f: 使用档案名字,切记,这个参数是最后一个参数,后面只能接档案名。 出处: 阅读全文

posted @ 2018-03-30 09:48 NothingLZ 阅读(240243) 评论(0) 推荐(4)

pandas使用
摘要:在读取log文件,用于生成文件名集合。 阅读全文

posted @ 2018-03-26 18:57 NothingLZ 阅读(298) 评论(0) 推荐(0)

相似度与距离计算python代码实现
摘要:1 #定义几种距离计算函数 2 #更高效的方式为把得分向量化之后使用scipy中定义的distance方法 3 4 from math import sqrt 5 def euclidean_dis(rating1, rating2): #欧式距离计算 6 """计算2个打分序列间的欧式距离. 输入的rating1和rating2都是打分dict 7 ... 阅读全文

posted @ 2018-03-23 22:24 NothingLZ 阅读(3693) 评论(0) 推荐(0)

逻辑回归原理(python代码实现)
摘要:Logistic Regression Classifier逻辑回归主要思想就是用最大似然概率方法构建出方程,为最大化方程,利用牛顿梯度上升求解方程参数。 优点:计算代价不高,易于理解和实现。 缺点:容易欠拟合,分类精度可能不高。 使用数据类型:数值型和标称型数据。 介绍逻辑回归之前,我们先看一问题 阅读全文

posted @ 2018-03-19 21:48 NothingLZ 阅读(23208) 评论(0) 推荐(2)

朴素贝叶斯文本分类(python代码实现)
摘要:朴素贝叶斯(naive bayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。 优点:在数据较少的情况下仍然有效,可以处理多分类问题。 缺点:对入输入数据的准备方式较为敏感。 使用数据类型:标称型数据。 下面从一个简单问题出发,介绍怎么使用朴素贝叶斯解决分类问题。 一天,老师问了个问题,只根据 阅读全文

posted @ 2018-03-19 21:41 NothingLZ 阅读(9588) 评论(0) 推荐(0)

KNN算法原理(python代码实现)
摘要:kNN(k-nearest neighbor algorithm)算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。简单地说,K-近邻算法采用测量不同特征值之间的距离方法进行分类。 - 优点:精度高、对异常值不敏感 阅读全文

posted @ 2018-03-19 21:35 NothingLZ 阅读(1526) 评论(0) 推荐(0)

决策树原理实例(python代码实现)
摘要:决策数(Decision Tree)在机器学习中也是比较常见的一种算法,属于监督学习中的一种。看字面意思应该也比较容易理解,相比其他算法比如支持向量机(SVM)或神经网络,似乎决策树感觉“亲切”许多。 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失值不敏感,可以处理不相关特征数据。 缺点:可 阅读全文

posted @ 2018-03-19 21:30 NothingLZ 阅读(34148) 评论(2) 推荐(2)

python之numpy.power()数组元素求n次方
摘要:numpy.power(x1, x2) 数组的元素分别求n次方。x2可以是数字,也可以是数组,但是x1和x2的列数要相同。 1 >>> x1 = range(6) 2 >>> x1 3 [0, 1, 2, 3, 4, 5] 4 >>> np.power(x1, 3) 5 array([ 0, 1, 阅读全文

posted @ 2018-03-11 13:47 NothingLZ 阅读(13739) 评论(0) 推荐(1)

django 保存中文到mysql 报错django.db.utils.DatabaseError: Incorrect string value: '\xE5\xBE\x88\xE7\x81\xB5
摘要:分析: 1.尝试在Python中对数据转码成utf8,'中文'.encode("utf-8"),还是报错 2.观察堆栈发现应该是操作mysql数据库的时候,将数据插入表里出错 所以第一种方式排除;集中从第二种原因找突破: 在mysql中查看字符相关的变量: 发现character_set_datab 阅读全文

posted @ 2018-03-09 13:42 NothingLZ 阅读(500) 评论(0) 推荐(0)

获取TypeError:__init __()缺少1个需要的位置参数:'on_delete'当试图添加父表后面的子表
摘要:解决办法:https://stackoverflow.com/questions/44026548/getting-typeerror-init-missing-1-required-positional-argument-on-delete 我添加了父表后,现在我models.py看起来像这样: 阅读全文

posted @ 2018-03-09 13:24 NothingLZ 阅读(464) 评论(0) 推荐(0)

正则表达式30分钟入门教程
摘要:本文目标 30分钟内让你明白正则表达式是什么,并对它有一些基本的了解,让你可以在自己的程序或网页里使用它。 如何使用本教程 最重要的是——请给我30分钟,如果你没有使用正则表达式的经验,请不要试图在30秒内入门——除非你是超人 :) 别被下面那些复杂的表达式吓倒,只要跟着我一步一步来,你会发现正则表 阅读全文

posted @ 2018-03-09 12:39 NothingLZ 阅读(163) 评论(0) 推荐(0)

Django + Uwsgi + Nginx 实现生产环境部署
摘要:本节内容 uwsgi 介绍 uwsgi安装使用 nginx安装配置 django with nginx 如何在生产上部署Django? Django的部署可以有很多方式,采用nginx+uwsgi的方式是其中比较常见的一种方式。 uwsgi介绍 uWSGI是一个Web服务器,它实现了WSGI协议、u 阅读全文

posted @ 2018-03-09 00:47 NothingLZ 阅读(143) 评论(0) 推荐(0)

python项目依赖并生成requirements.txt
摘要:使用pip freeze 这种方式配合virtualenv 才好使,否则把整个环境中的包都列出来了。 阅读全文

posted @ 2018-03-08 21:10 NothingLZ 阅读(104) 评论(0) 推荐(0)

用C语言解决python多线程中的GIL问题
摘要:在使用python多线程的时候为了解决GIL问题,有些代码得用C语言写,那么就得生成动态链接库。 当创建动态链接库时,独立位置信息(position independent)代码也需要生成。这可以帮助动态链接库或者跟多的加载地址信息来替代其他相对的地址信息。所以-fPIC这个选项作用很大,能快速准确 阅读全文

posted @ 2018-03-08 19:07 NothingLZ 阅读(234) 评论(0) 推荐(0)

Python基础:映射(字典)
摘要:一、概述 映射类型(Mapping Types)是一种关联式的容器类型,它存储了对象与对象之间的映射关系。 字典(dict)是Python中唯一的映射类型,它是存储了一个个 键值对(由 键 映射到 值)的关联容器。其中,键(key)必须是可哈希的Python对象,而 值(value)可以是任何Pyt 阅读全文

posted @ 2018-03-08 12:36 NothingLZ 阅读(358) 评论(0) 推荐(0)

简单的user-based协同过滤算法示例代码
摘要:#构造一份打分数据集1 users = {"小明": {"中国合伙人": 5.0, "太平轮": 3.0, "荒野猎人": 4.5, "老炮儿": 5.0, "我的少女时代": 3.0, "肖洛特烦恼": 4.5, "火星救援": 5.0}, 2 "小红":{"小时代4": 4.0, "荒野猎人": 阅读全文

posted @ 2018-03-06 21:59 NothingLZ 阅读(477) 评论(0) 推荐(0)

a标签打开设置
摘要:<a href="http://www.baidu.com" target="_Blank">百度</a>_Blank是新窗口_Self是自身_Parent是父窗口_Top是顶层窗口 阅读全文

posted @ 2018-03-06 18:58 NothingLZ 阅读(180) 评论(0) 推荐(0)

Linux常用文本操作命令整理
摘要:阅读目录 1.统计命令——wc 2.切分命令——cut 3.排序命令——sort 4.去重命令——uniq 5.查找命令——grep 6.替换/查找/删除命令——sed 7.强大的文本分析命令——awk 简单的总结一下常用的一些实用的Linux文本操作命令,包括wc(统计)、cut(切分)、sort 阅读全文

posted @ 2018-03-06 18:25 NothingLZ 阅读(836) 评论(0) 推荐(0)

git &github 快速入门
摘要:本节内容 为什么要用版本控制? 假设你在的公司要上线一个新功能,你们开发团队为实现这个新功能,写了大约5000行代码,上线没2天,就发现这个功能用户并不喜欢,你老板让你去掉这个功能,你怎么办?你说简单,直接把5000行代码去掉就行了,但是我的亲,说的简单,你的这个功能写了3周时间,但你还能记得你是新 阅读全文

posted @ 2018-03-06 18:20 NothingLZ 阅读(758) 评论(0) 推荐(0)

Restful API设计规范
摘要:理解RESTful架构、Restful API设计指南、理解RESTful架构 越来越多的人开始意识到,网站即软件,而且是一种新型的软件。 这种"互联网软件"采用客户端/服务器模式,建立在分布式体系上,通过互联网通信,具有高延时(high latency)、高并发等特点。 网站开发,完全可以采用软件 阅读全文

posted @ 2018-03-06 16:51 NothingLZ 阅读(157) 评论(0) 推荐(0)

git merge 和 git merge --no-ff
摘要:根据这张图片可以看出 git merge –no-ff 可以保存你之前的分支历史。能够更好的查看 merge历史,以及branch 状态。 git merge 则不会显示 feature,只保留单条分支记录。 阅读全文

posted @ 2018-03-06 15:54 NothingLZ 阅读(403) 评论(0) 推荐(0)

[Machine Learning & Algorithm] 朴素贝叶斯算法(Naive Bayes)
摘要:阅读目录 一、病人分类的例子 二、朴素贝叶斯分类器的公式 三、账号分类的例子 四、性别分类的例子 阅读目录 一、病人分类的例子 二、朴素贝叶斯分类器的公式 三、账号分类的例子 四、性别分类的例子 生活中很多场合需要用到分类,比如新闻分类、病人分类等等。 本文介绍朴素贝叶斯分类器(Naive Baye 阅读全文

posted @ 2018-03-05 18:13 NothingLZ 阅读(334) 评论(0) 推荐(0)

TF-IDF与余弦相似性的应用(三):自动摘要
摘要:有时候,很简单的数学方法,就可以完成很复杂的任务。 这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章。虽然它们算不上效果最好的方法,但肯定是最简便易行的方法。 今天,依然继续这个主题。讨论如何通过词频,对文章进行自动摘要(Automatic summarization)。 阅读全文

posted @ 2018-03-03 10:51 NothingLZ 阅读(249) 评论(0) 推荐(0)

TF-IDF与余弦相似性的应用(二):找出相似文章
摘要:今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到"余弦相似性"(cosine similiarity)。下面,我举一个例子来说明,什么是"余弦相似性"。 为 阅读全文

posted @ 2018-03-02 12:00 NothingLZ 阅读(210) 评论(0) 推荐(0)

TF-IDF与余弦相似性的应用(一):自动提取关键词
摘要:有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到? 这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一个非常简单的经典算法,可以给出令人相当满意的结果。它简单到都 阅读全文

posted @ 2018-03-02 11:52 NothingLZ 阅读(209) 评论(0) 推荐(0)

flume简介
摘要:组件介绍: 代理 Flume Agent agent source agent channel 监控网络端口使用 启动命令:flume-ng agent -n a1 -c $FLUME_HOME/conf -f $FLUME_HOME/conf/example.conf -Dflume.root.l 阅读全文

posted @ 2018-03-02 00:00 NothingLZ 阅读(184) 评论(0) 推荐(0)

导航