2017年9月25日
摘要: 这篇文章主要介绍了python中的拷贝问题,即不同的拷贝方式得到的新对象,对其进行修改是否影响原对象。了解这一块,首先需要了解数据类型,所以接下来从数据类型讲起。 依据对象在内存中的组织分类,可以分为以下两种类型: 一. 原子类型:只能保存单个字面对象的类型, 如数值(所有的数值类型),字符串(全部 阅读全文
posted @ 2017-09-25 17:36 寒若雪 阅读(644) 评论(0) 推荐(0) 编辑
  2017年9月5日
摘要: 1. SQL(Structure Quest Language) 一种结构化查询语言,它是一种通用的关系型数据库操作语言,用于存取数据,查询,更新和管理数据库。 2. 基本语句 Select, Create, Insert, Drop 3. SQL语句注意事项 1)SQL语句中,英文字母大写或小写均 阅读全文
posted @ 2017-09-05 11:04 寒若雪 阅读(1636) 评论(0) 推荐(0) 编辑
  2017年9月4日
摘要: 题目: 果园里有一堆苹果,一共n头(n大于1小于9)熊来分,第一头为小东,它把苹果均分n份后,多出了一个,它扔掉了这一个,拿走了自己的一份苹果,接着第二头熊重复这一过程,即先均分n份,扔掉一个然后拿走一份,以此类推直到最后一头熊都是这样(最后一头熊扔掉后可以拿走0个,也算是n份均分)。问最初这堆苹果 阅读全文
posted @ 2017-09-04 22:46 寒若雪 阅读(403) 评论(0) 推荐(0) 编辑
摘要: 问题: 1维,1米长的路面,每次下一滴雨,每滴雨落到地面上长度是0.01米,落点假设均匀分布,求问下了多少滴雨之后路面会全部湿透,求期望? 分析: 把一米长的路面分成100个格子,每个格子都落了雨滴了那么路面就湿透了。随机性在于每次哪个格子落雨是不确定的。 分析到这,了解优惠券收集问题的人应该知道这 阅读全文
posted @ 2017-09-04 22:19 寒若雪 阅读(6665) 评论(0) 推荐(0) 编辑
  2017年7月7日
摘要: 转载自:http://www.zmonster.me/2016/06/08/use-stanford-nlp-package-in-nltk.html 目录 NLTK 与 Stanford NLP 安装和配置 注意事项 StanfordSegmenter StanfordTokenizer Stan 阅读全文
posted @ 2017-07-07 16:20 寒若雪 阅读(2432) 评论(1) 推荐(1) 编辑
  2017年6月30日
摘要: 今天看自然语言处理这本书的时候,被这里的高级函数的概念吸引了,因为我觉得所有的函数都只是函数而已,是为了实现特定功能而实现的,不应该有高级,低级之分啊!不过了解之后,发现这几个函数确实是有点高级,非常好用,所以在这里做一个简单的总结。 1. Haskell:之前以为它是一个函数,其实它是一个统称。H 阅读全文
posted @ 2017-06-30 20:16 寒若雪 阅读(2089) 评论(0) 推荐(0) 编辑
摘要: 本文主要列举使用for循环遍历类似list结果的方式,因为老是使用for e in w_list真的是太没创意了,这显然不是我的风格,嘿嘿。。。 1. for item in s: 遍历s中的元素 2. for item in sorted(s): 按顺序遍历s中的元素 3. for item in 阅读全文
posted @ 2017-06-30 19:49 寒若雪 阅读(4247) 评论(0) 推荐(0) 编辑
  2017年6月29日
摘要: 在做英文文本处理时,常常会遇到这样的情况,需要我们提取出里面的词组进行主题抽取,尤其是具有行业特色的,比如金融年报等。其中主要进行的是进行双连词和三连词的抽取,那如何进行双连词和三连词的抽取呢?这是本文将要介绍的具体内容。 1. nltk.bigrams(tokens) 和 nltk.trigram 阅读全文
posted @ 2017-06-29 21:38 寒若雪 阅读(5478) 评论(0) 推荐(2) 编辑
  2017年6月27日
摘要: nlp 常用工具 转自 http://www.cppblog.com/baby-fly/archive/2010/10/08/129003.html *NLP Toolbox CLT http://complingone.georgetown.edu/~linguist/compling.html 阅读全文
posted @ 2017-06-27 21:26 寒若雪 阅读(1293) 评论(0) 推荐(0) 编辑
摘要: 大家都知道TreeTagger是一个用于词性标注和词型还原的工具,它的返回结果由三部分组成:目标词汇,词性,原形。那该工具是怎样判断目标词汇的词性的呢?又是怎样得到目标词汇的原形的呢?本文就是从这两个问题入手,对TreeTagger的原理进行简单的介绍。 1. 词性的识别判断 这里词性的识别采用的决 阅读全文
posted @ 2017-06-27 17:02 寒若雪 阅读(5404) 评论(1) 推荐(0) 编辑