上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 41 下一页
  2012年2月6日
摘要: #!/usr/bin/python#-*-coding:cp936-*-#思路,将str转换成unicode,方可用正则表达式,前提是,要知道文件的编码,本例中是gbkimportcPickleasmypickleimportreimportsysif(__name__=='__main__'):fid1=file('above50purenames.txt','r');p=re.compile('(^\s+|\s+$)');phanzigbk=re.compile('[\\x20-\\x7f]');phanzi= 阅读全文
posted @ 2012-02-06 23:14 finallyly 阅读(27245) 评论(0) 推荐(0) 编辑
  2012年2月2日
摘要: http://blog.csdn.net/sfrysh/article/details/6538391最近阅读《鸟哥的linux私房菜》,确实是一本好书,使自己在文件属性和权限方面有了较深的理解,总结如下。(注:本篇博文的图片来自于《鸟哥的linux私房菜》一书)一、提纲本篇博文主要包含以下几个部分:1. 用户和用户组的概念;2. 文件属性;3. 目录与一般文件的区别;4. ls命令的使用详解;二、用户和用户组 linux的系统是“多用户、多任务环境”的,也就是说“linux系统允许多个用户同时使用系统,并且可以同时执行不同的任务”。所以为了确保各个用户的文件安全, linux系统具有非常严格 阅读全文
posted @ 2012-02-02 20:06 finallyly 阅读(1746) 评论(0) 推荐(0) 编辑
  2012年1月31日
摘要: 1.导数据 mssql-mysql2.mysql-文本 select keywords,publishTime from paper into outfile "c:/a.txt" character set gbk;++++++++++++++++++++++++++++++++++++++3. red hat 9.0 linux 英文版如何显示汉字3.1 安装 汉字相关包,在redhat9.0安装盘3上面9.0不在第一张盘上,在第三张盘上.rpm包名分别为: ttfonts-zh_CN-2.12-1.noarch.rpm(简体中文) ttfonts-zh_TW-2.11 阅读全文
posted @ 2012-01-31 21:24 finallyly 阅读(564) 评论(0) 推荐(0) 编辑
  2012年1月15日
摘要: 作者:finallyly 出处:博客园 (转载请注明 作者和出处)前言:感谢dudu和博客园的支持,我于2010年10月曾在博客园的个人博客中发布了个人整理的汉语新闻分类语料,以及文本分类流程程序。 历时两年收到了广大网友的支持、批评和指正。现在面临毕业,所以对自己硕士阶段的工作进行了部分开源。文本语料库(包括中英文新闻)的详细说明以及下载地址为:http://www.datatang.com/data/13484文本分类程序最新版的详细说明以及下载地址为:http://www.datatang.com/data/13483文本分类的中间表达形式VSM模型的详细说明以及下载地址为:(1)英文语 阅读全文
posted @ 2012-01-15 09:45 finallyly 阅读(10964) 评论(23) 推荐(6) 编辑
  2012年1月11日
摘要: “科技创新,方法先行”。为响应科技部“十二五”关于加强科技资源共享的号召,中科院自动化所“自动化学科创新思想与科学方法研究(课题编号:2009IM020300)”课题 与国内专业的科研数据共享平台-数据堂 网站展开全面合作,将自动化学科数字化知服务网络平台的部分后台数据,以及项目中的一些其他数据资源,免费提供给自然语言处理等相关领域同仁从事科研使用。数据专区地址是:http://www.datatang.com/member/5878。如您论文或项目使用该专区数据,请注明数据来自“自动化学科创新思想与科学方法研究”课题,编号2009IM020300,以及数据堂数据地址http://www.d. 阅读全文
posted @ 2012-01-11 11:15 finallyly 阅读(1819) 评论(0) 推荐(0) 编辑
  2012年1月5日
摘要: (1)认为写的比较好的python正则表达式指南见http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html(2)正则匹配中关于单行模式以及多行模式的一些说明摘自http://hi.baidu.com/jiyeqian/blog/item/4ffe5d18ab3aa61735fa4198.html行模式主要用于改变点号的匹配规则,而多行模式用于改变 ^ 和 $ 的匹配规则;默认情况下单行模式和多行模式均处于 off 状态,可以分别激活或同时激活这两种模式。 开启单行模式:(?s);开启多行模式:(?m)默认情况下,点号能够匹配除换行符 阅读全文
posted @ 2012-01-05 16:48 finallyly 阅读(1102) 评论(0) 推荐(0) 编辑
  2012年1月3日
摘要: 1.shell调用py脚:比如我有个py:import sysfor i in sys.stdin: print i我用shell调用直接写就行:echo 'asdfadsf' | ./test.py2.python调用shellimport os,commandsos.system('cp a.txt b.txt')#只调用不返回commands.getoutput('ls -al')#调用返回值 阅读全文
posted @ 2012-01-03 16:50 finallyly 阅读(2773) 评论(0) 推荐(0) 编辑
摘要: 我有的时候写程序要用到当前时间,我就想用python去取当前的时间,虽然不是很难,但是老是忘记,用一次丢一次,为了能够更好的记住,我今天特意写下python 当前时间这篇文章,如果你觉的对你有用的话,可以收藏下。取得时间相关的信息的话,要用到python time模块,python time模块里面有很多非常好用的功能,你可以去官方文档了解下,要取的当前时间的话,要取得当前时间的时间戳,时间戳好像是1970年到现在时间相隔的时间。你可以试下下面的方式来取得当前时间的时间戳:import timeprint time.time()输出的结果是:1279578704.6725271但是这样是一连串 阅读全文
posted @ 2012-01-03 16:16 finallyly 阅读(4018) 评论(0) 推荐(0) 编辑
  2011年12月29日
摘要: 各位同学、老师、网友,大家好,由中科院自动化所综合信息中心承担、国家科技部支持的自动化学科数字化知识服务网络平台已经上线。网站地址是:http://autoinnovation.ia.ac.cn/,欢迎大家使用,并且给我们提出意见和建议。下面是平台使用过程中的几点注意事项:(1)初次使用时,如果您的浏览器没有安装silverlight插件,请您按提示下载安装该插件;(2)如果您在使用中遇到一些小问题,可以查看网站的帮助文件;(3)该平台框架实际为数据库检索系统,因此您输入检索词后,需要等待下拉菜单出现相应检索词,选中相应检索词,之后在点击搜索按钮,如下图所示图 1 检索说明示意图该平台主要包括 阅读全文
posted @ 2011-12-29 10:45 finallyly 阅读(769) 评论(8) 推荐(3) 编辑
  2011年12月5日
摘要: 利用grep 和find查找文件内容想到自己常用的方法也不错,特记录下来:#grep "printf" $(find . -name *.c)gizp a.txt 源文件变成a.txt.gzgzip 压缩文件解压tar.gz的,用tar zxvf.tar.bz2的,用tar jxvf.tar的,用tar xvf创建压缩文件,上述三条中的x换成c如果脚本中有>>插入符,那么脚本开始之初要touch filelsof | grep part find . -name "*.debug" -exec rm -rfv {} \;echo -e &qu 阅读全文
posted @ 2011-12-05 19:32 finallyly 阅读(294) 评论(0) 推荐(0) 编辑
上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 41 下一页