摘要:
1 from heapq import *; 2 from collections import *; 3 import random as rd; 4 import operator as op; 5 import re; 6 7 data = [2,2,6,7,9,12,34,0,76,-12, 阅读全文
摘要:
tensorflow中自带的mnist手写数字识别,运用最简单的单层神经网络,softmax激活函数,极客学院上说准确率有91%,我今天调整到了92%!import tensorflow as tfimport numpy as npimport mathimport tensorflow.exam 阅读全文
摘要:
之前研究的CRF算法,在中文分词,词性标注,语义分析中应用非常广泛。但是分词技术只是NLP的一个基础部分,在人机对话,机器翻译中,深度学习将大显身手。这篇文章,将展示深度学习的强大之处,区别于之前用符号来表示语义,深度学习用向量表达语义。这篇文章的最大价值在于,为初学者指明了研究方向。下面为转载的原 阅读全文
摘要:
中文分词有很多方法,比如N-最短路径法,N元语言模型,CRF模型等等。大致可以分为两类:一是机械化的分词,二是用机器学习方法分词。最短路径算法可以划分到第一种。这个算法效果并不是最好的,大体和IK分词打成平手。今天用最简洁语言描述一下:这个算法主要分两步:第一,构造DAG(有向无环图),第二找出最优 阅读全文
摘要:
机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到这个世界上,还吸引了那么多世人的目光。 我希望自 阅读全文
摘要:
看了宗成庆博士的《统计自然语言处理(中文信息处理)》的第六章,对维特比算法有着非常精辟的讲解。把其中的讲解上传上来,个人感觉比较正统。 今天用Java实现了这个算法,也可以转换为C代码: 测试文件: 输出结果为1,0,0,就是sunny,rainy,rainy。对比了一下,结果没问题,逻辑也没问题。 阅读全文
摘要:
苏伟峰 李绍滋 厦门大学计算机科学系 厦门 361005 摘 要 本文提出一个电子文档的自动分类的模型:基于《知网》之上,经过对文档的关键词的抽取和排岐, 进而得到关键词的概念,再对关键词的概念进行综合而得到该文本的所属的类别,实验证明该模型有较好的效果。 关键词 文本分类 概念 《知网》 全信息 阅读全文
摘要:
基于《知网》的词汇语义相似度计算[1] 刘群†‡李素建† {liuqun,lisujian}@ict.ac.cn † 中国科学院计算技术研究所 ‡ 北京大学计算语言学研究所 摘要: 《知网》是一部比较详尽的语义知识词典。在基于实例的机器翻译中,词语相似度计算是一个重要的环节。不过,由于《知网》中对于 阅读全文
摘要:
一日下课,遇见几名学生问我:虫老师,控制系统的稳定性、鲁棒性、与非脆弱性本质上是否一回事呢?好像都是对不确定性的抵御能力,划分的这样细,实在有些费解。虫老师,你能用我们一听就明白的话给我们说一说么? 这个问题是控制系统的三个最为重要的基本概念。其中,稳定性一百多年前就有了十分完善的数学理论了,鲁棒性 阅读全文
摘要:
今天开始学习tensorflow框架,从极客学院下载了官方中文教程(15年翻译的),第一天开始学习第一章ng基本流程和原理,作为前奏。然后写了代码,验证一下,准确率确实非常高,非常好用。把代码上传,作为以后备用。 1 import tensorflow as tf 2 import numpy as 阅读全文