python代码小实践之split_csv

摘要: '''This python script is used to split the .arff file got from marsyas to .csv files, which is easier to be read into the matlab for further processs.Create on 2012-7-13@auther: mainred'''import xlrd, xlwtimport timeimport reimport osfile_name = raw_input('please input na 阅读全文
posted @ 2012-08-09 11:29 mainred 阅读(501) 评论(0) 推荐(0) 编辑

python代码小实践之dorm_lab_changeIP

摘要: 为了方便能在寝室和实验室之间往返后更改电脑ip,参考了blogjava中qunjunlong123的文章,并添加了测试网络连接小功能。用py2exe打包为exe文件。创建快捷方式,然后以管理员身份运行(这个很重要,要不然ip改不了)。# -*- coding: cp936 -*-import wmiimport urllib2IPV4_25 = {'arrIPAddresses':['10.110.87.19'], 'arrSubnetMasks':['255.255.255.0'], 'arrDefaultGateway 阅读全文
posted @ 2012-08-09 11:27 mainred 阅读(376) 评论(0) 推荐(0) 编辑

python 笔记

摘要: N Python语言把引号解释为纯字符串操作符,创建的操作符都是文字性的,单引号和双引号没有什么区别For的特殊用法:拆分序列>>> a=[c for c in 'abcdefg']>>> a['a', 'b', 'c', 'd', 'e', 'f', 'g']>>>按if条件拆分序列>>> a=[c for c in '123456' if int(c)<3] 如果if的条 阅读全文
posted @ 2012-02-12 21:24 mainred 阅读(252) 评论(0) 推荐(1) 编辑

weighing scheme

摘要: 选以简单的介绍开始,因为以后的文章可能会提到这里面的一些概念,事先写好,也算练练手。传统重量一个单词大小的方法是测量它在文章中的重要性以及考虑它在文章的特征。(1)TF-IDF(term frequency,inverse document frequency)Salton等人[1]提出了TF-IDF,这种方法用来衡量一个术语在整个语料库中的权重。术语在语料库中的重要性会随着它在一个文本中出现的频率的增加而增大,但是与它在整个语料库中出现频率成反比。在衡量一个术语的权重时,如果仅凭术语在文章中出现的次数的话,显然文章长度大的中的术语会比文章长度小的相同术语权重会高,所以我们应该做一些归一化,即 阅读全文
posted @ 2012-02-12 21:23 mainred 阅读(359) 评论(0) 推荐(0) 编辑