摘要: 九. awk实用功能: 和sed一样,awk也是逐行扫描文件的,从第一行到最后一行,寻找匹配特定模板的行,并在这些行上运行“选择”动作。如果一个模板没有指定动作,这些匹配的行就被显示在屏幕上。如果一个动作没有模板,所有被动作指定的行都被处理。 1. awk的基本格式: /> awk 'pattern 阅读全文
posted @ 2016-12-23 19:57 小_龟 阅读(260) 评论(0) 推荐(0) 编辑
摘要: 七. grep家族: 1. grep退出状态: 0: 表示成功; 1: 表示在所提供的文件无法找到匹配的pattern; 2: 表示参数中提供的文件不存在。 见如下示例: /> grep 'root' /etc/passwd root:x:0:0:root:/root:/bin/bash opera 阅读全文
posted @ 2016-12-23 19:55 小_龟 阅读(182) 评论(0) 推荐(0) 编辑
摘要: 八. 流编辑器sed: sed一次处理一行文件并把输出送往屏幕。sed把当前处理的行存储在临时缓冲区中,称为模式空间(pattern space)。一旦sed完成对模式空间中的行的处理,模式空间中的行就被送往屏幕。行被处理完成之后,就被移出模式空间,程序接着读入下一行,处理,显示,移出......文 阅读全文
posted @ 2016-12-23 19:51 小_龟 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 一. 特殊文件: /dev/null和/dev/tty Linux系统提供了两个对Shell编程非常有用的特殊文件,/dev/null和/dev/tty。其中/dev/null将会丢掉所有写入它的数据,换句换说,当程序将数据写入到此文件时,会认为它已经成功完成写入数据的操作,但实际上什么事都没有做。 阅读全文
posted @ 2016-12-23 19:49 小_龟 阅读(186) 评论(0) 推荐(0) 编辑
摘要: HTML 1、一套规则,浏览器认识的规则。 2、开发者: 学习Html规则 开发后台程序: 写Html文件(充当模板的作用) 数据库获取数据,然后替换到html文件的指定位置(Web框架) 3、本地测试 找到文件路径,直接浏览器打开 pycharm打开测试 4、编写Html文件 doctype对应关 阅读全文
posted @ 2016-11-11 10:50 小_龟 阅读(147) 评论(0) 推荐(0) 编辑
摘要: 注:本笔记基于python2.6而编辑,尽量的偏向3.x的语法 Python的特色 1.简单 2.易学 3.免费、开源 4.高层语言: 封装内存管理等 5.可移植性: 程序如果避免使用依赖于系统的特性,那么无需修改就可以在任何平台上运行 6.解释性: 直接从源代码运行程序,不再需要担心如何编译程序, 阅读全文
posted @ 2016-11-02 10:13 小_龟 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 mysql数据库 mysql数据库常见名词: 数据库: 数据库是一些关联表的集合。. 数据表: 表是数据的矩阵。在一个数据库中的表看起来像一个简单的电子表格。 列: 一列(数据元素) 包含了相同的数据, 例如邮政编码的数据。 行:一行(=元组,或记录)是一组相关的数据,例如一条用户订阅 阅读全文
posted @ 2016-10-27 17:13 小_龟 阅读(270) 评论(0) 推荐(0) 编辑
摘要: 任务一:现在有一篇长文《中国的蜜蜂养殖》,用计算机提取它的关键词。 1、词频:如果某个词很重要,它应该在这篇文章中多次出现。我们进行"词频"(Term Frequency,缩写为TF)统计。 2、停用词:结果你肯定猜到了,出现次数最多的词是 "的"、"是"、"在" 这一类最常用的词。它们叫做"停用词 阅读全文
posted @ 2016-10-19 10:22 小_龟 阅读(35050) 评论(0) 推荐(3) 编辑
摘要: 词性标注器 CC 并列连词 RB 副词 IN 连词 JJ 形容词 帮助文档使用 nltk.help.upenn_tagset( 'RB*') text = nltk.Text(word.lower() for word in nltk.corpus.brown.words()) text.simil 阅读全文
posted @ 2016-10-18 17:08 小_龟 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 功能 1):分词 jieba.cut方法接受两个输入参数: 1) 第一个参数为需要分词的字符串 2)cut_all参数用来控制是否采用全模式 jieba.cut_for_search方法接受一个参数:需要分词的字符串,该方法适合用于搜索引擎构建倒排索引的分词,粒度比较细 注意:待分词的字符串可以是g 阅读全文
posted @ 2016-10-18 17:07 小_龟 阅读(233) 评论(0) 推荐(0) 编辑