摘要:
快速链接: 这一章没有解决的问题 目录与重点内容: 编译系统 hello程序的运行过程 高速缓存器 操作系统 计算机系统的抽象 Amdahl加速比定律公式 并发与并行 这一章术语(请ctrl+F正文内查找): 位,字节,字符,文本,ASCII, 文本文件,二级制文件,机器指令,可执行目标程序,编译器 阅读全文
摘要:
(这篇大部分图表和数据整理于17年12月3号) 去年12月3号,共和党减税法案宣布通过,我当天跟进了网上沸沸扬扬的讨论。我关注减税法案的原因,主要是这涉及到留学花费的问题:此法案把博士生的tuition waiver部分被免除的当做了收入,计算下来博士生每年要多交好几万人民币。法案出台即引起众怒,有 阅读全文
摘要:
文本处理 sed 酷壳 sed 简明教程 http://coolshell.cn/articles/9104.html awk 酷壳 AWK 简明教程 http://coolshell.cn/articles/9070.html 阅读全文
摘要:
17.4.9 mysqldump 因为租用的阿里云服务器ECS到期了,着手将博客搬到更便宜的共享虚拟主机上。之前安装的环境是MySQL5.5.54,PHP5.5.9,Apache2;共享虚拟主机提供的环境是MySQL5.1以下,PHP5.5以下。因此MySQL使用 导出的时候,需要加上一个 的参数。 阅读全文
摘要:
本篇持续更新中 用户问答列表 Python官方文档中的FAQ Frequent Asked Questions 部分。https://docs.python.org/2.7/faq/ 目前Programming FAQ有60问 General Questions 5 Core Language 17 阅读全文
摘要:
上图是一个经典的数据分析/数据挖掘步骤链(pipeline)。在将数据送到(load)你选择的model之前,数据必须经过提取(select/extract)、预处理(preprocess)包括转化(transform)才能形成一个单纯的算法model可以理解的结构化形式。 提到这个长长的数据处理的 阅读全文
摘要:
背景知识 文件描述符(file descriptor) 『它是一个索引值,指向内核为每一个进程所维护的该进程打开文件的记录表。当程序打开一个现有文件或者创建一个新文件时,内核向进程返回一个文件描述符』https://zh.wikipedia.org/wiki/%E6%96%87%E4%BB%B6%E 阅读全文
摘要:
有一个常见的场景:有一段代码的运行时间比较长,另对应的有一个输入集合。因此通常采用循环的方式将参数从输入集合中取出来让代码运行。 最简单的写法是这样的: 通常情况下这种方式会遇到一些问题。举两个我经常遇到的例子: 1. 是爬虫代码, 是页面地址。进行到 的时候,ip/账号被对方网站限制访问了。 2. 阅读全文
摘要:
key value格式的存储的应用场景很多,通用的描述是『输入一个唯一标识的input,返回(查找)一个对应的output』。Python中字典(dictionary)就是一个内置的解决方案 Python的字典本质上是一个哈希表,功能可对应Java的HashMap,但据说被尽可能地优化过(没有研究过 阅读全文
摘要:
众所周知,由于python(Cpython)的全局锁(GIL)问题存在,导致Thread也就是线程的并行并不可实现。 multiprocessing 模块采用多进程而不是多线程的方式实现并行,解决了GIL的问题,一定程度上使状况得到了缓解。 然而,Multiprocess本身依然有一些功能上的瓶颈。 阅读全文