摘要: 压缩和归档管理 tar :归档管理 此命令可以把一系列文件归档到一个大文件中, 使用格式: v :显示进度 f :指定文件名称, f后面一定是.tar文件, 此参数必须放在选项最后 t :列出文档中包含的文件 x :解开tar文件 gzip :文件压缩和解压 tar只负责打包, 但不压缩, 用gzi 阅读全文
posted @ 2016-10-02 01:10 qlshine 阅读(277) 评论(0) 推荐(0) 编辑
摘要: 用户, 权限管理 Linux中root账号通常用于系统的维护和管理, 它对操作系统的所有部分具有不受限制的访问权限 在Unix/Linux安装过程中, 系统会自动创建许多用户账号, 而这些默认的用户就称为"标准用户" whoami :查看当前用户 查看当前系统当前账号的用户名, 可以通过 查看系统用 阅读全文
posted @ 2016-10-02 01:10 qlshine 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 系统管理 cal :查看当前月份和日历, 加 查看整年日历 date :显示或设置时间 设置时间格式(需要管理员权限) CC为年的前两位 YY为年后两位 MM为月 DD为日 hh为时 mm为分 ss为秒 如: , 表示2016年1月2号3点4分55秒 ps :查看进程信息 进程是一个具有一定独立功能 阅读全文
posted @ 2016-10-02 01:10 qlshine 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 用户目录 位于/home/user, 称为用户目录或家目录, 表示方法: /home/user ~ 相对路径和绝对路径 绝对路径 从 / 目录开始描述的路径外绝对路径 cd /home cd /usr 相对路径 从当前位置开始描述的路径为相对路径 cd ../../ ls abc/def . 和 . 阅读全文
posted @ 2016-10-02 01:09 qlshine 阅读(206) 评论(0) 推荐(0) 编辑
摘要: Linux目录 / :根目录, 一般只存放目录, 在Linux下只有一个根目录. 所有的东西都是从这里开始 /bin, /usr/bin :可执行的二进制文件目录, 如常用的ls, tar, mv, cat /boot :linux系统启动时用到的一些文件, 如linux内核文件: /boot/vm 阅读全文
posted @ 2016-10-02 01:08 qlshine 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 在UNIX和Linux的操作系统中, 每个文件(文件夹也被看作是文件)都按读, 写, 运行设定权限 比如用 或`ll`命令列文件表时, 得到如下输出: 从第二个字符起 是说用户apple有 读权,写权, 没有运行权 接着的 表示用户组users只有读权限, 没有写权限和运行权 最后的 指其他人(ot 阅读全文
posted @ 2016-10-02 01:08 qlshine 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 查看服务器系统信息 查看linux系统类型和版本 查看语言字符集设置 查看用户 阅读全文
posted @ 2016-10-02 01:07 qlshine 阅读(772) 评论(0) 推荐(0) 编辑
摘要: 西刺代理爬虫 1. 新建项目和爬虫 2. 测试 返回500, 猜测是没有加 导致 返回正常 3. 在项目的settings中去掉 的注释 4. 编写items.py item定义存储哪些字段 5. 编写spider 编写spider的时候可以通过命令行工具 来测试要提取数据的xpath语法, 这样更 阅读全文
posted @ 2016-10-01 17:40 qlshine 阅读(5389) 评论(0) 推荐(3) 编辑
摘要: 对于要提取嵌套标签所有内容的情况, 使用 或`//text()`, 注意两者区别 使用text() 使用string 阅读全文
posted @ 2016-10-01 17:39 qlshine 阅读(4068) 评论(0) 推荐(0) 编辑
摘要: 查看所有命令 查看帮助信息 查看版本信息 新建一个工程 构建爬虫 (generator spider) 一个工程中可以存在多个spider, 但是名字必须唯一 查看当前项目内有多少爬虫 使用浏览器打开网页 shell命令, 进入scrpay交互环境 之后便进入交互环境 我们主要使用这里面的 命令, 阅读全文
posted @ 2016-10-01 17:39 qlshine 阅读(9711) 评论(0) 推荐(1) 编辑