摘要:
python 中的字典属于一种高级数据结构,基于的基本数据结构是hash表,hash表在查找某一元素中的复杂度基本上等于O(1),因此是非常好用的数据结构。下面简介一下资本的一些字典的操作一、创建字典,给字典赋值NameRank={}NameRank={1:ada,2:aka,3:jia,4:gxy... 阅读全文
摘要:
Note: This information comes from "Bracketing Guidelines for Treebank II Style Penn Treebank Project" - part of the documentation that comes with the ... 阅读全文
摘要:
python中用try来处理程序异常的集中常用方法如果你在写python程序时遇到异常后想进行如下处理的话,一般用try来处理异常,假设有下面的一段程序:try: 语句1 语句2 . 语句N except.........: print.......如果你并不知道"语句1至语句N"在执行时会出什么样... 阅读全文
摘要:
目前我常常使用的分词有结巴分词、NLPIR分词等等最近是在使用结巴分词,稍微做一下推荐,还是蛮好用的。一、结巴分词简介利用结巴分词进行中文分词,基本实现原理有三:基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG)采用了动态规划查找最大概率路径, 找出基于... 阅读全文
摘要:
简单介绍一下python里IO的几种常用方式。当然除了以下介绍的几种方式之外,还可以参考python的手册,例如我想查找raw_input函数的用法,我就可以直接使用命令:python -m pydoc raw_input(windows底下)来查看使用方法,使用完毕时候,输入“q”作为退出。下面进... 阅读全文
摘要:
(根据计算机世界/2007年/10月/22日/第B15版文章改编)开源工具对统计翻译带来的意义不必多说,想必也都能体会出来。Brown等提出IBM模型是在20世纪90年代初,而IBM模型广泛使用和研究的年份竟然是1999年以后!促成这种想象的原因竟是开源工具包的出现!开源工具的出现,降低了研究的准入... 阅读全文
摘要:
Tip one 选方向:新的学期开始了,不知道怎么选题的人儿看过来。研究僧和本科生最大的区别在于——没有了标准答案,所有的探索都有可能变成一次试错的过程,珍惜总结过程中的错误,是一个好的僧应该具备的素质。大的研究方向一般是实验组给定,这个选择不再细说。这里谈谈如何在一个大的研究方向下给自己找到一个能... 阅读全文
摘要:
人工智能的道路我们还有很长的路要走,我们期待一场未来与机器人的真正博弈,而这种博弈的结果是:人与机器的和谐共存,生活的更加便捷。从我们感受到的智能来举例,如果你的手机是iphone,那你一定不会对siri陌生,这个人机交互的神器,可以帮助我们读短信、介绍餐厅、询问天气、语音设置闹钟。当然,这都不... 阅读全文
摘要:
盈利模式的分析三点重要Tips:1.attract the resources2.build the capabilities to execute3.create value for stakeholders 感谢老师出的这个题目,让我开始陷入了一场新的思考之中;看似平常的事物,因为进一步思考而变得更加的有趣;我姑且拿google来做文章。很难想象,支撑Google庞大搜索工程,竟然是一种非常单一的搜索主题,以及非常简洁的广告模式。那么google究竟特殊在了哪里?从表面上,Google是一家成功了的技术公司的一切典型特征:公司创始人年纪轻轻就已成为亿万富翁。然而,Google的真正内质却. 阅读全文
摘要:
机器翻译软件从实验室走向市场 冯志伟机器翻译研究如何用计算机来进行不同自然语言之间的翻译,它是自然语言计算机处理的一个历史悠久的部门,是横跨语言学、数学、计算机科学的综合性学科,也是计算机软件应用的一个重要领域。随着计算机网络的迅速普及和推广,随着信息高速公路的发展,网络上不同语言之间交际越来越普遍,语言的障碍也显得越来越严重,机器翻译是克服信息时代的语言障碍的不可缺少的手段,它在现代信息社会中的巨大作用将会越来越明显。由于自然语言的极端复杂性,机器翻译是当代科学技术的十大难题之一。早在在17世纪,一些有识之士就提出了采用机器词典来克服语言障碍的想法。笛卡儿(Descartes)... 阅读全文