11 2016 档案
摘要:Pycharm 鼠标移动到函数上,CTRL+Q可以快速查看文档,CTR+P可以看基本的参数。 apply(),applymap()和map() apply()和applymap()是DataFrame的函数,map()是Series的函数。 apply()的操作对象是DataFrame的一行或者一列
阅读全文
摘要:进程:程序的一次执行(程序载入内存,系统分配资源运行)。每个进程有自己的内存空间,数据栈等,进程之间可以进行通讯,但是不能共享信息。 线程:所有的线程运行在同一个进程中,共享相同的运行环境。每个独立的线程有一个程序入口,顺序执行序列和程序的出口。 线程的运行可以被强占,中断或者暂时被挂起(睡眠),让
阅读全文
摘要:最长公共子序列和最长子串是不一样的,公共子序列是A,B中按顺序出现的相同元素,元素不要求连续,而子串是要求连续的。 1暴力,对于较短的那条字符串,他的每个元素选中,或者没有被选中,有2^n种子串的情况,再与较长的比较,需要O(M*2N)。 2动态规划,关于动态规划,可参考http://wenku.b
阅读全文
摘要:自然语言处理 -->计算机数据 ,计算机可以处理vector,matrix 向量矩阵。 NLTK 自然语言处理库,自带语料,词性分析,分类,分词等功能。 简单版的wrapper,比如textblob。 一 简单的文本预处理流水线 1.分词 Tokenize 长句子分成有意义的小部件。 nltk的分词
阅读全文
摘要:一 内置函数 bin()、oct()、hex()的返回值均为字符串,且分别带有0b、0o、0x前缀。 实例 统计二进制数里1的个数 二 format 实例 求两个二进制字符串的和 不能用内置函数 此外format还有很多其他功能,控制精度,对齐等格式化输出。 上面统计1的个数也可以写成
阅读全文

浙公网安备 33010602011771号