摘要: //stata操作 *************************数据基本操作****************************** gen varname = value //定义变量 replace varname = newvalue if ... //修改满足条件...的varna 阅读全文
posted @ 2018-07-19 17:06 程序猿Time 阅读(3181) 评论(0) 推荐(0) 编辑
摘要: python读写TXT文件不需要导入包 python中常用的读写方式: r+ 、w+、 a+的区别: r+会覆盖当前文件指针所在位置的字符,如原来文件内容是"Hello,World",打开文件后写入"hi"则文件内容会变成"hillo, World" w+与r+的不同是,w+在打开文件时就会先将文件 阅读全文
posted @ 2018-06-06 20:36 程序猿Time 阅读(794) 评论(0) 推荐(0) 编辑
摘要: csv数据特点: csv是文本格式,一行数据是一条记录,每个单元之间用“,”隔开。csv数据可以用Excel打开。 读写csv文件的主要程序如下所示: 本文读写采用缓冲流的方式进行读写,缓冲流有降低程序运行时间的特点。 值得注意的是,一定要在恰当的位置关闭缓冲流,避免造成缓冲区数据为输出,导致数据的 阅读全文
posted @ 2018-06-06 20:26 程序猿Time 阅读(261) 评论(0) 推荐(0) 编辑
摘要: 本文采用http://gc.ditu.aliyun.com地址进行经纬度匹配,无数量限制 如果给定经纬度进行geohash加密操作,先解密得到相应gps坐标,具体程序如下所示: 根据上述得到的地址进行地址匹配,具体程序如下: 地址匹配信息如下,可按名称提取相应信息: 阅读全文
posted @ 2018-06-05 11:06 程序猿Time 阅读(2883) 评论(0) 推荐(0) 编辑
摘要: 需要安装第三方包:requests 本次经纬度匹配采用高德地图api,首先将gps坐标转化为高德地图的经纬度坐标,然后再根据转化后的坐标进行匹配。 本次匹配主要是获取距离给定经纬度最近的poi点地址信息。 主要程序如下所示: 运行结果如下图所示: 如果需要获取其他地址信息可输出对应的answer中的 阅读全文
posted @ 2018-06-05 10:42 程序猿Time 阅读(1407) 评论(0) 推荐(0) 编辑
摘要: 安装第三方包:gensim 首先,执行去停词操作(去除与主题无关的词) 然后,执行主题分类操作 注意:上述主题分类,仅使用lda模型(根据频数计算) 也可混合使用tf-idf模型XX-topic下代码改为如下即可: 或 常用方式为方式一,作者暂时为弄清楚这两种方式的区别,后期将会继续完善 阅读全文
posted @ 2018-06-04 21:31 程序猿Time 阅读(6761) 评论(0) 推荐(0) 编辑
摘要: 相关文件下载: jdk下载路径:http://www.oracle.com/technetwork/java/javase/downloads/index.html eclipse下载路径:https://www.eclipse.org/downloads/ 文件安装: 按照提示进行安装即可(若要修 阅读全文
posted @ 2018-06-04 20:44 程序猿Time 阅读(162) 评论(0) 推荐(0) 编辑