寒若雪 - 博客园

2017年9月25日

摘要：这篇文章主要介绍了python中的拷贝问题，即不同的拷贝方式得到的新对象，对其进行修改是否影响原对象。了解这一块，首先需要了解数据类型，所以接下来从数据类型讲起。依据对象在内存中的组织分类，可以分为以下两种类型：一. 原子类型：只能保存单个字面对象的类型，如数值（所有的数值类型），字符串（全部阅读全文

posted @ 2017-09-25 17:36 寒若雪阅读(644) 评论(0) 推荐(0) 编辑

2017年9月5日

数据分析---SQL（Access数据库）

摘要： 1. SQL（Structure Quest Language）一种结构化查询语言，它是一种通用的关系型数据库操作语言，用于存取数据，查询，更新和管理数据库。 2. 基本语句 Select, Create, Insert, Drop 3. SQL语句注意事项 1）SQL语句中，英文字母大写或小写均阅读全文

posted @ 2017-09-05 11:04 寒若雪阅读(1636) 评论(0) 推荐(0) 编辑

2017年9月4日

试题2---分苹果

摘要：题目：果园里有一堆苹果，一共n头(n大于1小于9)熊来分，第一头为小东，它把苹果均分n份后，多出了一个，它扔掉了这一个，拿走了自己的一份苹果，接着第二头熊重复这一过程，即先均分n份，扔掉一个然后拿走一份，以此类推直到最后一头熊都是这样(最后一头熊扔掉后可以拿走0个，也算是n份均分)。问最初这堆苹果阅读全文

posted @ 2017-09-04 22:46 寒若雪阅读(403) 评论(0) 推荐(0) 编辑

试题1---经典概率问题：优惠券收集问题

摘要：问题： 1维，1米长的路面，每次下一滴雨，每滴雨落到地面上长度是0.01米，落点假设均匀分布，求问下了多少滴雨之后路面会全部湿透，求期望？分析：把一米长的路面分成100个格子，每个格子都落了雨滴了那么路面就湿透了。随机性在于每次哪个格子落雨是不确定的。分析到这，了解优惠券收集问题的人应该知道这阅读全文

posted @ 2017-09-04 22:19 寒若雪阅读(6665) 评论(0) 推荐(0) 编辑

2017年7月7日

在 NLTK 中使用 Stanford NLP 工具包

摘要：转载自：http://www.zmonster.me/2016/06/08/use-stanford-nlp-package-in-nltk.html 目录 NLTK 与 Stanford NLP 安装和配置注意事项 StanfordSegmenter StanfordTokenizer Stan 阅读全文

posted @ 2017-07-07 16:20 寒若雪阅读(2432) 评论(1) 推荐(1) 编辑

2017年6月30日

Python---高级函数map, filter, zip, enumerate等的用法

摘要：今天看自然语言处理这本书的时候，被这里的高级函数的概念吸引了，因为我觉得所有的函数都只是函数而已，是为了实现特定功能而实现的，不应该有高级，低级之分啊！不过了解之后，发现这几个函数确实是有点高级，非常好用，所以在这里做一个简单的总结。 1. Haskell:之前以为它是一个函数，其实它是一个统称。H 阅读全文

posted @ 2017-06-30 20:16 寒若雪阅读(2089) 评论(0) 推荐(0) 编辑

Python---遍历序列的各种方式

摘要：本文主要列举使用for循环遍历类似list结果的方式，因为老是使用for e in w_list真的是太没创意了，这显然不是我的风格，嘿嘿。。。 1. for item in s：遍历s中的元素 2. for item in sorted(s)：按顺序遍历s中的元素 3. for item in 阅读全文

posted @ 2017-06-30 19:49 寒若雪阅读(4247) 评论(0) 推荐(0) 编辑

2017年6月29日

nltk中的三元词组，二元词组

摘要：在做英文文本处理时，常常会遇到这样的情况，需要我们提取出里面的词组进行主题抽取，尤其是具有行业特色的，比如金融年报等。其中主要进行的是进行双连词和三连词的抽取，那如何进行双连词和三连词的抽取呢？这是本文将要介绍的具体内容。 1. nltk.bigrams(tokens) 和 nltk.trigram 阅读全文

posted @ 2017-06-29 21:38 寒若雪阅读(5478) 评论(0) 推荐(2) 编辑

2017年6月27日

自然语言处理常用工具

摘要： nlp 常用工具转自 http://www.cppblog.com/baby-fly/archive/2010/10/08/129003.html *NLP Toolbox CLT http://complingone.georgetown.edu/~linguist/compling.html 阅读全文

posted @ 2017-06-27 21:26 寒若雪阅读(1293) 评论(0) 推荐(0) 编辑

TreeTagger

摘要：大家都知道TreeTagger是一个用于词性标注和词型还原的工具，它的返回结果由三部分组成：目标词汇，词性，原形。那该工具是怎样判断目标词汇的词性的呢？又是怎样得到目标词汇的原形的呢？本文就是从这两个问题入手，对TreeTagger的原理进行简单的介绍。 1. 词性的识别判断这里词性的识别采用的决阅读全文

posted @ 2017-06-27 17:02 寒若雪阅读(5404) 评论(1) 推荐(0) 编辑

公告