摘要: 为了提升聚类效率,使用多线程是必须的,在此过程中对多线程又多了一些了解 一、多线程中尽量不可大量使用Math.random()。由于Math.random()中会使用CAS机制,所以频繁使用会导致线程执行速度变慢。可自行书写单线程代码和多线程代码测试,产生同样多个随机数,会发现多线程执行速度是慢于单 阅读全文
posted @ 2019-08-28 15:49 五十一步 阅读(337) 评论(0) 推荐(0) 编辑
摘要: 在这次聚类功能的完成过程中,增长了一些工作经验: 一、中间结果应当存储:整个功能分成两段过程,第一部分是请求引擎,获取分词结果,第二部分是根据分词结果聚类。第一部分请求引擎的分词结果应当保存,不管是查问题还是继续调试均能起到很好的帮助,后面更是开辟了一个功能,直接使用分词结果文件进行聚类,不需要第一 阅读全文
posted @ 2019-08-28 15:29 五十一步 阅读(303) 评论(0) 推荐(0) 编辑