摘要: 本文记录了用新浪微博官方Python SDK调用API进行开发的流程。准备工作申请成为开发者并创建一个应用:首先要有一个新浪微博的账号,然后去新浪微博开放平台(http://open.weibo.com/)创建一个应用,具体的步骤官网文档介绍的非常详细:在开发者页面点击“登录” -> “创建应用” ... 阅读全文
posted @ 2015-05-15 22:13 小白菜的BLOG 阅读(4794) 评论(0) 推荐(2) 编辑
摘要: Mallet是Umass大牛开发的一个关于统计自然语言处理的l的开源库,很好的一个东西。可以用来学topic model,训练ME模型等。对于开发者来说,其官网的技术文档是非常有效的。mallet下载地址,浏览开发者文档,只需点击相应的“Developer's Guide”。下面以开发一个简单的最大... 阅读全文
posted @ 2014-12-24 16:40 小白菜的BLOG 阅读(3158) 评论(3) 推荐(0) 编辑
摘要: 本栏目来源于对Coursera在线课程NLP(by Michael Collins)的理解。课程链接为:https://class.coursera.org/nlangp-0011. Tagging Problems1.1 POS Tagging问题描述Input:Profits soared at... 阅读全文
posted @ 2014-12-09 14:35 小白菜的BLOG 阅读(805) 评论(0) 推荐(0) 编辑
摘要: CoreNLP在Eclipse下的使用方法。 阅读全文
posted @ 2014-12-09 14:07 小白菜的BLOG 阅读(12744) 评论(3) 推荐(0) 编辑
摘要: 字符串操作:字符串分割:String array[] = str.split("\t");字符串截取:str.substring(0,2);字符串比较:str1.equals(str2)数组操作:array定义:type[] 变量名 = new type[数组中元素的个数]; //eg: int[]... 阅读全文
posted @ 2014-12-01 17:45 小白菜的BLOG 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 语言模型,马尔科夫模型,bigram,trigram 阅读全文
posted @ 2014-10-27 19:37 小白菜的BLOG 阅读(1595) 评论(0) 推荐(0) 编辑
摘要: liblinear参数及使用,java语言 阅读全文
posted @ 2014-10-23 17:57 小白菜的BLOG 阅读(12470) 评论(1) 推荐(1) 编辑
摘要: spark1.0.0下使用scala实现机器学习算法,包括分类、回归、聚类、协同过滤以及降维等。 阅读全文
posted @ 2014-06-16 17:48 小白菜的BLOG 阅读(6254) 评论(2) 推荐(1) 编辑
摘要: spark1.0.0 集群 Standalone Applications scala sbt 阅读全文
posted @ 2014-06-11 17:21 小白菜的BLOG 阅读(2438) 评论(0) 推荐(0) 编辑
摘要: 现在大家可以跟我一起来实现Ubuntu 12.04下Hadoop 2.2.0 集群搭建,在这里我使用了两台服务器,一台作为master即namenode主机,另一台作为slave即datanode主机,增加更多的slave只需重复slave部分的内容即可。系统版本:master:Ubuntu 12.... 阅读全文
posted @ 2014-06-10 09:49 小白菜的BLOG 阅读(4004) 评论(0) 推荐(0) 编辑