利用余弦定理计算文本的相似度
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- from __future__ import division import jieba.analyse from math import sqrt class Similarity(): def __init__(self, target1, target2, topK=10): ...
阅读全文
posted @
2017-01-25 16:23
细雨微光
阅读(2032)
推荐(0) 编辑
Linux命令(24) :sort
摘要:转载地址:点击 linux 命令详解 sort是在Linux里非常常用的一个命令,管排序的,集中精力,五分钟搞定sort,现在开始! 1 sort的工作原理 sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。 [rocrocke
阅读全文
posted @
2017-01-09 14:41
细雨微光
阅读(246)
推荐(0) 编辑
python(30) 获取网页返回的状态码,状态码对应问题查询
摘要:获取访问网页返回的状态码 以下内容来自于维基百科:点击查看网页 1xx消息 这一类型的状态码,代表请求已被接受,需要继续处理。这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束。由于HTTP/1.0协议中没有定义任何1xx状态码,所以除非在某些试验条件下,服务器禁止向此类客户端发送
阅读全文
posted @
2017-01-06 15:05
细雨微光
阅读(11507)
推荐(0) 编辑
python(29)强大的zip函数
摘要:zip函数:它是python的内建函数,(与序列有关的内建函数有:sorted()、reversed()、enumerate()、zip()),其中sorted()和zip()返回一个序列(列表)对象,reversed()、enumerate()返回一个迭代器(类似序列) 代码一: 代码二: 代码三
阅读全文
posted @
2017-01-05 20:28
细雨微光
阅读(341)
推荐(0) 编辑
python(28)获得网卡的IP地址,如何在其他文件夹中导入python模块
摘要:获得第几块网卡的ip地址: 如何在其他文件夹中导入模块 获取网卡的IP地址和后缀:
阅读全文
posted @
2017-01-05 14:34
细雨微光
阅读(242)
推荐(0) 编辑
Linux命令(27):shell 结合expect,多服务器批量分发数据
摘要:shell 结合expect 写的批量scp脚本工具 except安装:http://www.cnblogs.com/lovychen/p/6525623.html expect用于自动化地执行linux环境下的命令行交互任务,例如scp、ssh之类需要用户手动输入密码然后确认的任务。有了这个工具,
阅读全文
posted @
2017-01-03 14:55
细雨微光
阅读(1576)
推荐(0) 编辑