11 2019 档案
摘要:一、init system 1、计算机是如何启动的 以早期 Fedora 系统为例。 1、开机 2、BIOS 和 GRUB(引导加载程序) 3、Linux 内核启动后,init 进程 是在 Fedora 上启动的第一个进程。进程 ID (PID) 为 1。它是系统中所有其它进程的母亲,用于启动其他服
阅读全文
摘要:零、写在前面 本文涉及的反爬技术,仅供个人技术学习,禁止并做到: 干扰被访问网站的正常运行 抓取受到法律保护的特定类型的数据或信息 搜集到的数据禁止传播、交给第三方使用、或者牟利 如有可能,在爬到数据后24小时候内删除 具体可参考 2019年5月28号 颁布的 "《数据安全管理办法(征求意见稿)》"
阅读全文
摘要:环境:CentOS 7 (阿里云服务器) 一、linux 发行版下的包管理阵营 包管理系统 除了方便你安装和管理包之外,还能帮你 解决依赖问题 。 下面就介绍2个最主要的: 1、Debian 系 dpkg (Debian Package Management System),中文为 Debian 包
阅读全文
摘要:背景:之前做 Scrapy 爬虫,遇到一些编码的问题,导致自己损耗了一些不必要的时间,还是基础知识不扎实呀,所以专门来整理整理,遂成此篇。 一、概念 这里先厘清一些概念,方便接下来的阐述。 字节 byte:是计算机存储数据的存储单元,是一个8位的二进制数,所以最多只能表示256个数字(0-255)
阅读全文
摘要:一、Node.js 日志 1、原生 Node.js 原生方法其实很简单,就四个: 配合 pm2 的 log 功能(参见我之前的 blog: "pm2 官方文档学习笔记 小蒋不素小蒋 博客园" ),可以对项目实现基础的日志功能。(目前我采用的也是这种) 2、第三方库 debug:比较简单,expres
阅读全文
摘要:零、写在前面 本文涉及的反爬技术,仅供个人技术学习,禁止并做到: 干扰被访问网站的正常运行 抓取受到法律保护的特定类型的数据或信息 搜集到的数据禁止传播、交给第三方使用、或者牟利 如有可能,在爬到数据后24小时候内删除 具体可参考 2019年5月28号 颁布的 《数据安全管理办法(征求意见稿)》 一
阅读全文
摘要:一、背景 为公司负责 Data Science 的同事配置线上 jupyter_server (jupyter + jupyter_kernel_gateway)环境。 二、环境 CentOS 7.6 三、安装 从最基础的 python 安装开始介绍。 1、python 采用编译安装,版本为 3.7
阅读全文
摘要:一、介绍 1、是什么 npm 全称是 Node Package Manager,即 Node 包管理工具。 但是发展到后来,并不仅是适用于 node.js 的包。 所以现在看 node_modules 这个名字实在有点偏颇,现在 npm 自己都说自己是通用的包管理,并不局限于 node,然而这名字却
阅读全文