随笔档案「2017年4月」 - Django's blog

CRF++地名实体识别（特征为词性和词）

摘要：http://x-algo.cn/index.php/2016/02/29/crf-name-entity-recognition/ 类似使用CRF实现分词和词性标注，地域识别也是需要生成相应的tag进行标注。这里使用的语料库是1998年1月人民日报语料集。最终学习出来的模型，对复杂的地名识别准确率阅读全文

posted @ 2017-04-28 18:32 Django's blog 阅读(4766) 评论(1) 推荐(0)

转：CRF++

摘要：CRF++使用小结 http://www.cnblogs.com/pangxiaodong/archive/2011/11/21/2256264.html 1. 简述最近要应用CRF模型，进行序列识别。选用了CRF++工具包，具体来说是在VS2008的C#环境下，使用CRF++的windows版本阅读全文

posted @ 2017-04-28 18:14 Django's blog 阅读(347) 评论(0) 推荐(0)

ProBase

摘要：http://haixun.olidu.com/probase.html A Data Driven Semantic Network for Text Understanding Probase is a data driven semantic network that consists of 阅读全文

posted @ 2017-04-26 10:01 Django's blog 阅读(763) 评论(0) 推荐(0)

图形数据库 Neo4j 开发实战

摘要：https://www.ibm.com/developerworks/cn/java/j-lo-neo4j/ Neo4j 是一个高性能的 NoSQL 图形数据库。Neo4j 使用图（graph）相关的概念来描述数据模型，把数据保存为图中的节点以及节点之间的关系。很多应用中数据之间的关系，可以很直接地阅读全文

posted @ 2017-04-25 20:15 Django's blog 阅读(2030) 评论(0) 推荐(0)

Linux 下升级python和安装pip

摘要：Linux版本升级： 1、首先确认Linux操作系统中自带的python 版本时候与自己所需要的版本一致所有的python版本都在https://www.python.org/ftp/python/ 选择下载 2、 wget https://www.python.org/ftp/python/2 阅读全文

posted @ 2017-04-24 15:57 Django's blog 阅读(558) 评论(0) 推荐(0)

TensorFlow (RNN)深度学习双向LSTM(BiLSTM)+CRF 实现 sequence labeling 序列标注问题源码下载

摘要：http://blog.csdn.net/scotfield_msn/article/details/60339415 在TensorFlow (RNN)深度学习下双向LSTM(BiLSTM)+CRF 实现 sequence labeling 双向LSTM+CRF跑序列标注问题源码下载去年底样阅读全文

posted @ 2017-04-24 13:36 Django's blog 阅读(3197) 评论(0) 推荐(0)

开源项目kcws代码分析--基于深度学习的分词技术

摘要：http://blog.csdn.net/pirage/article/details/53424544 分词原理本小节内容参考待字闺中的两篇博文：简单的说，kcws的分词原理就是：另外，字符嵌入的表示可以是纯预训练的，但也可以在训练模型的时候再fine-tune,一般而言后者效果更好。对于f 阅读全文

posted @ 2017-04-24 13:31 Django's blog 阅读(1354) 评论(0) 推荐(0)

文本情感分类（二）：深度学习模型

摘要：在《文本情感分类（一）：传统模型》一文中，笔者简单介绍了进行文本情感分类的传统思路。传统的思路简单易懂，而且稳定性也比较强，然而存在着两个难以克服的局限性：一、精度问题，传统思路差强人意，当然一般的应用已经足够了，但是要进一步提高精度，却缺乏比较好的方法；二、背景知识问题，传统思路需要事先提取好情感阅读全文

posted @ 2017-04-24 13:20 Django's blog 阅读(701) 评论(0) 推荐(0)

文本情感分类（一）：传统模型

摘要：前言：四五月份的时候，我参加了两个数据挖掘相关的竞赛，分别是物电学院举办的“亮剑杯”，以及第三届 “泰迪杯”全国大学生数据挖掘竞赛。很碰巧的是，两个比赛中，都有一题主要涉及到中文情感分类工作。在做“亮剑杯”的时候，由于我还是初涉，水平有限，仅仅是基于传统的思路实现了一个简单的文本情感分类模型。而在后阅读全文

posted @ 2017-04-24 13:19 Django's blog 阅读(1528) 评论(0) 推荐(0)

重要博文

摘要：http://blog.csdn.net/itplus/article/details/21905449 突然意识到，进到博客后，我的博文在主页上是按照发表时间的顺序展示的，各种类型的文章混合在一起，实在不便于查阅，虽然通过分章分类也可进行一定的区分，但分类多了也比较麻烦。因此，为方便自己查阅，同时阅读全文

posted @ 2017-04-24 13:18 Django's blog 阅读(256) 评论(0) 推荐(0)

LSTM 文本情感分析/序列分类 Keras

摘要：LSTM 文本情感分析/序列分类 Keras 请参考 http://spaces.ac.cn/archives/3414/ neg.xls是这样的 pos.xls是这样的neg=pd.read_excel(‘neg.xls’,header=None,index=None) pos=pd.read_e 阅读全文

posted @ 2017-04-24 13:12 Django's blog 阅读(4840) 评论(0) 推荐(0)

97.5%准确率的深度学习中文分词（字嵌入+Bi-LSTM+CRF）

摘要：http://www.17bigdata.com/97-5%E5%87%86%E7%A1%AE%E7%8E%87%E7%9A%84%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D%EF%BC%88%E5% 阅读全文

posted @ 2017-04-24 13:09 Django's blog 阅读(3616) 评论(0) 推荐(0)

详细解读简单的lstm的实例

摘要：http://blog.csdn.net/zjm750617105/article/details/51321889 本文是初学keras这两天来，自己仿照addition_rnn.py，写的一个实例，数据处理稍微有些不同，但是准确性相比addition_rnn.py 差一点，下面直接贴代码，解释和阅读全文

posted @ 2017-04-24 13:05 Django's blog 阅读(3333) 评论(0) 推荐(0)

如何使用 Pylint 来规范 Python 代码风格

摘要：https://www.ibm.com/developerworks/cn/linux/l-cn-pylint/ Pylint 是什么 Pylint 是一个 Python 代码分析工具，它分析 Python 代码中的错误，查找不符合代码风格标准（Pylint 默认使用的代码风格是 PEP 8，具体信阅读全文

posted @ 2017-04-11 08:58 Django's blog 阅读(518) 评论(0) 推荐(0)

Python下Json和Msgpack序列化比较

摘要：Python下Json和Msgpack序列化比较最近用Python时，遇到了序列化对象的问题，传统的json和新型序列化工具包msgpack都有涉及，于是做一个简单的总结：通俗的讲：序列化：将对象信息转化为可以存储或传输的形式；反序列化：把这个存储的内容还原成对象。 json就不用多做解释了，是阅读全文

posted @ 2017-04-09 23:09 Django's blog 阅读(1065) 评论(0) 推荐(0)

除了cPickle,cjson外还有没有更高效点的序列化库了

摘要：除了cPickle,cjson外还有没有更高效点的序列化库了 http://blog.csdn.net/chen_lovelotus/article/details/7228745 msgpack最快，而且是跨语言的,二进制,但只能打包简单的list,dict,int,string,unicode，阅读全文

posted @ 2017-04-09 23:03 Django's blog 阅读(559) 评论(0) 推荐(0)

python对象序列化或持久化的方法

摘要：http://blog.csdn.net/chen_lovelotus/article/details/7233293 一、Python对象持久化方法目前为止，据我所知，在python中对象持久化有以下几种方法： 1. 使用(dbhash/bsddb, dbm, gdbm, dumbdbm 等）以阅读全文

posted @ 2017-04-09 23:01 Django's blog 阅读(3415) 评论(0) 推荐(0)

Python标准库 (pickle包，cPickle包)

摘要：在之前对Python对象的介绍中 (面向对象的基本概念，面向对象的进一步拓展)，我提到过Python“一切皆对象”的哲学，在Python中，无论是变量还是函数，都是一个对象。当Python运行时，对象存储在内存中，随时等待系统的调用。然而，内存里的数据会随着计算机关机和消失，如何将对象保存到文件，并阅读全文

posted @ 2017-04-09 22:16 Django's blog 阅读(10809) 评论(0) 推荐(0)

pickle和cPickle：Python对象的序列化（上）

摘要：https://segmentfault.com/a/1190000002493548 pickle模块实现了一种算法，将任意一个Python对象转化成一系列字节（byets）。此过程也调用了serializing对象。代表对象的字节流之后可以被传输或存储，再重构后创建一个拥有相同特征（the sa 阅读全文

posted @ 2017-04-09 22:08 Django's blog 阅读(465) 评论(0) 推荐(0)

pickle模块的基本使用

摘要：python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去，永久存储；通过pickle模块的反序列化操作，我们能够从文件中创建上一次程序保存的对象。基本接口： pickle.dump(obj, file, [,prot 阅读全文

posted @ 2017-04-07 19:57 Django's blog 阅读(965) 评论(0) 推荐(0)

python使用pickle,json等序列化dict

摘要：import pickle, json, csv, os, shutil class PersistentDict(dict): ''' Persistent dictionary with an API compatible with shelve and anydbm. The dict is 阅读全文

posted @ 2017-04-07 19:01 Django's blog 阅读(363) 评论(0) 推荐(0)

python模块之bsddb: bdb高性能嵌入式数据库 1.基础知识

摘要：http://blog.csdn.net/zhaoweikid/article/details/1665741 bsddb模块是用来操作bdb的模块，bdb是著名的Berkeley DB，它的性能非常好，mysql的存储后端引擎都支持bdb的方式。这里简单介绍一些关于bsddb的使用方法。 bdb不阅读全文

posted @ 2017-04-07 18:20 Django's blog 阅读(867) 评论(0) 推荐(0)

Django's blog

04 2017 档案

公告