2014年8月14日

再次学习快速排序

摘要: 快速排序已经看过好几遍了,经常因为小的bug,写错程序,为了以后少犯类似的错误,在这记下来。快速排序的原理比较简单,运用递归的思想,每次用一个元素将原来的数组进行分割,关键是找对分割的位置。将前后两部分分割成小于分割元素和大于分割元素,然后递归对前后两部分继续快速排序两部分代码:第一部分是快速排序的... 阅读全文

posted @ 2014-08-14 10:45 ywf—java 阅读(191) 评论(0) 推荐(0) 编辑

2014年5月14日

读取XML文件

摘要: package com.app;import java.util.ArrayList;import java.util.Arrays;import java.util.HashSet;import java.util.Iterator;import java.util.LinkedHashMap;i... 阅读全文

posted @ 2014-05-14 15:18 ywf—java 阅读(182) 评论(0) 推荐(0) 编辑

2014年3月27日

情感分析笔记

摘要: http://52opencourse.com/235/斯坦福大学自然语言处理第七课-情感分析(sentiment-analysis)情感分析(Sentiment analysis),又称倾向性分析,意见抽取(Opinion extraction),意见挖掘(Opinion mining),情感挖掘(Sentiment mining),主观分析(Subjectivity analysis),它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,如从评论文本中分析用户对“数码相机”的“变焦、价格、大小、重量、闪光、易用性”等属性的情感倾向。情感分析主要目的就是识别用户对事物或人的看法、 阅读全文

posted @ 2014-03-27 14:50 ywf—java 阅读(830) 评论(0) 推荐(0) 编辑

2014年3月26日

Tika解析word文件

摘要: Apache POI - HWPF and XWPF - Java API to Handle Microsoft Word Fileshttp://poi.apache.org/document/http://grepcode.com/snapshot/repo1.maven.org/maven2/org.apache.poi/poi-scratchpad/3.7http://grepcode.com/snapshot/repo1.maven.org/maven2/org.apache.poi/poi-ooxml/3.7对Doc文件的解析需要poi-scratchpad/3.7.jarPOI 阅读全文

posted @ 2014-03-26 10:25 ywf—java 阅读(5277) 评论(5) 推荐(1) 编辑

2013年9月6日

判断字符的类型

摘要: private static CharType getType(char c) { CharType tag; int type = Character.getType(c); if (Character.isLowerCase(c)||Character.isUpperCase(c)){ tag = CharType.L; } else if (c == 12288 || c == 32) {//Character.isWhitespace(c) || Character.isSpaceChar(c) ... 阅读全文

posted @ 2013-09-06 13:53 ywf—java 阅读(588) 评论(0) 推荐(0) 编辑

2013年8月19日

JAVA调用命令行2

摘要: package loadMBQL;import java.io.File;import java.io.FilenameFilter;public class LoadMBQL { /** * @param args * @throws Exception */ public static void main(String[] args) throws Exception { String exeName = "E:\\ShenTong\\bin\\oimpexp.exe"; String srcFilePath = "E:/source data/MB_QL/n 阅读全文

posted @ 2013-08-19 10:07 ywf—java 阅读(394) 评论(0) 推荐(0) 编辑

2013年8月18日

正则表达式总结2

摘要: 正则表达式中元字符在字符组内部和外部的意义是不相同的。^:在字符组外部是指行开头的标识,例如^y是以字母y开头 在字符组内部是指排除型标识,例如[^y]是排除以y开头|:是分隔任意表达式的元字符,在字符组外部使用,如果在字符组内部使用,就是一般的"|"字符[abc]:表示a或者b或者c(a|b|c):表示a表达式,b表达式,c表达式(|一般用于表达式)\表示一个字母的结束。例如\>:表示以:结束?标志可选项,加在一个字符的后面表示此处容许出现这个字符+表示之前紧邻的字符出现一次或多次*表示之前紧邻的字符出现任意多次,或者不出现[0-9]+可以表示任意大小的数字 ,-表 阅读全文

posted @ 2013-08-18 17:15 ywf—java 阅读(171) 评论(0) 推荐(0) 编辑

2013年8月17日

通过JAVA调用命令行程序

摘要: 这是我在把数据导入到数据库时遇到问题,总结下来的。包含两个方法,一个方法是读取文件路径下的文件列表,主方法是执行cmd命令,在导入时想得到导入一个文件的时间,涉及到线程阻塞问题,这个问题理解不是很深,应该是执行cmd命令时,相当于开启了一个新的线程,如果需要线程执行完再开启新的线程,需要阻塞新线程,用到了WaitFor().代码如下:package loadFile;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundExcepti 阅读全文

posted @ 2013-08-17 16:49 ywf—java 阅读(1007) 评论(0) 推荐(0) 编辑

2013年8月16日

自然语言处理课件

摘要: 百度文库http://wenku.baidu.com/album/view/f4f40a4cf7ec4afe04a1df34?fr=hittag&album=cover&tag_type=1 阅读全文

posted @ 2013-08-16 11:13 ywf—java 阅读(306) 评论(0) 推荐(0) 编辑

用户兴趣图谱总结

摘要: http://blog.csdn.net/xiewenbo/article/details/7707985新浪微博兴趣图谱研究是文本挖掘和社区分析的综合,用户兴趣既有文本信息又有社交行为,需要从这两方面去挖掘,新浪微博有标签的功能,但是存在标签是否有效的问题,因此需要从自标签和用户文本信息两个方面综合分析,确定用户的兴趣。构建微博用户兴趣可用的信息源有:文本内容——用户原创微博、用户转发微博、评论微博、回复内容自标签——用户自己定义的标签社交行为——参加的群组、圈子等等[张俊林]标签传播算法http://ajktsy3rlm.l17.yunpan.cn/lk/QXK9MJG35yd7g算法思想 阅读全文

posted @ 2013-08-16 11:04 ywf—java 阅读(1161) 评论(0) 推荐(0) 编辑

导航