随笔 - 404
文章 - 0
评论 - 1037
阅读 -
136万
01 2012 档案
移植算法编译环境到linux【redhat9.0如何显示汉字】
摘要:1.导数据 mssql-mysql2.mysql-文本 select keywords,publishTime from paper into outfile "c:/a.txt" character set gbk;++++++++++++++++++++++++++++++++++++++3. red hat 9.0 linux 英文版如何显示汉字3.1 安装 汉字相关包,在redhat9.0安装盘3上面9.0不在第一张盘上,在第三张盘上.rpm包名分别为: ttfonts-zh_CN-2.12-1.noarch.rpm(简体中文) ttfonts-zh_TW-2.11
阅读全文
文本分类资源和程序开源共享
摘要:作者:finallyly 出处:博客园 (转载请注明 作者和出处)前言:感谢dudu和博客园的支持,我于2010年10月曾在博客园的个人博客中发布了个人整理的汉语新闻分类语料,以及文本分类流程程序。 历时两年收到了广大网友的支持、批评和指正。现在面临毕业,所以对自己硕士阶段的工作进行了部分开源。文本语料库(包括中英文新闻)的详细说明以及下载地址为:http://www.datatang.com/data/13484文本分类程序最新版的详细说明以及下载地址为:http://www.datatang.com/data/13483文本分类的中间表达形式VSM模型的详细说明以及下载地址为:(1)英文语
阅读全文
NLP资源共享盛宴
摘要:“科技创新,方法先行”。为响应科技部“十二五”关于加强科技资源共享的号召,中科院自动化所“自动化学科创新思想与科学方法研究(课题编号:2009IM020300)”课题 与国内专业的科研数据共享平台-数据堂 网站展开全面合作,将自动化学科数字化知服务网络平台的部分后台数据,以及项目中的一些其他数据资源,免费提供给自然语言处理等相关领域同仁从事科研使用。数据专区地址是:http://www.datatang.com/member/5878。如您论文或项目使用该专区数据,请注明数据来自“自动化学科创新思想与科学方法研究”课题,编号2009IM020300,以及数据堂数据地址http://www.d.
阅读全文
Python正则表达式
摘要:(1)认为写的比较好的python正则表达式指南见http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html(2)正则匹配中关于单行模式以及多行模式的一些说明摘自http://hi.baidu.com/jiyeqian/blog/item/4ffe5d18ab3aa61735fa4198.html行模式主要用于改变点号的匹配规则,而多行模式用于改变 ^ 和 $ 的匹配规则;默认情况下单行模式和多行模式均处于 off 状态,可以分别激活或同时激活这两种模式。 开启单行模式:(?s);开启多行模式:(?m)默认情况下,点号能够匹配除换行符
阅读全文
转载:shell python脚本互调
摘要:1.shell调用py脚:比如我有个py:import sysfor i in sys.stdin: print i我用shell调用直接写就行:echo 'asdfadsf' | ./test.py2.python调用shellimport os,commandsos.system('cp a.txt b.txt')#只调用不返回commands.getoutput('ls -al')#调用返回值
阅读全文
转载 用python 获取当前时间
摘要:我有的时候写程序要用到当前时间,我就想用python去取当前的时间,虽然不是很难,但是老是忘记,用一次丢一次,为了能够更好的记住,我今天特意写下python 当前时间这篇文章,如果你觉的对你有用的话,可以收藏下。取得时间相关的信息的话,要用到python time模块,python time模块里面有很多非常好用的功能,你可以去官方文档了解下,要取的当前时间的话,要取得当前时间的时间戳,时间戳好像是1970年到现在时间相隔的时间。你可以试下下面的方式来取得当前时间的时间戳:import timeprint time.time()输出的结果是:1279578704.6725271但是这样是一连串
阅读全文