01 2016 档案

摘要:测试表geoinfo,整个表超过1100万行,表结构:CREATE TABLE `geoinfo` (`objectid` int(11) NOT NULL AUTO_INCREMENT ,`latitude` double NOT NULL ,`longitude` double NOT N... 阅读全文
posted @ 2016-01-27 12:19 morein2008 阅读(356) 评论(0) 推荐(0) 编辑
摘要:对于大数据量的表格,尤其是百万行以上的数据表,一定要对其建立索引,否则查询速度极慢。(参考后面的测试结果)建立索引时需注意:MySQL的索引有两种:单列索引(即在某一列上建索引)、多列组合索引(即在多个列上建立同一个索引),不像SQL Server分聚集索引,非聚集索引。如何建立单列索引:格式:CR... 阅读全文
posted @ 2016-01-26 19:40 morein2008 阅读(1462) 评论(0) 推荐(0) 编辑
摘要:Python获取指定路径下的子目录和文件有两种方法: os.listdir(dir)和os.walk(dir),前者列出dir目录下的所有直接子目录和文件的名称(均不包含完整路径),如 >>> os.listdir(r'E:')['$RECYCLE.BIN', 'Download', 'test.t 阅读全文
posted @ 2016-01-25 13:19 morein2008 阅读(419) 评论(0) 推荐(0) 编辑
摘要:Python的字符串处理(包括整数等转换)、日期处理(加减、格式化为字符串、时间差)、文件读写、迭代器、类静态、成员方法构造器、多态、Type、异常处理、正则表达式Java同样。轨迹数据的分析:分时段(找出高峰期)、高峰期即各个时段哪里出租车最多,有多少?载客时一般去哪里,载客率、何时客人最多,何时... 阅读全文
posted @ 2016-01-22 21:03 morein2008 阅读(163) 评论(0) 推荐(0) 编辑
摘要:本例用Python操纵MySQL,从指定文件读取数据,并对数据进行处理,处理之后批量插入MySQL。贴上代码:# -*- coding: gbk -*-import reimport MySQLdbimport timedef select(sqlselect): try: co... 阅读全文
posted @ 2016-01-22 20:47 morein2008 阅读(1476) 评论(0) 推荐(0) 编辑
摘要:唠叨几句: 近期在做数据分析,需要对数据做可视化处理,也就是画图,一般是用Matlib来做,但Matlib安装文件太大,不太想直接用它,据说其代码运行效率也很低,在网上看到可以先用Java做数据处理,然后调用Matlib来画图,另外,还可以使用Matplotlib,它是用Python写的类似Matl 阅读全文
posted @ 2016-01-22 12:04 morein2008 阅读(11124) 评论(0) 推荐(0) 编辑
摘要:要审核就不发 阅读全文
posted @ 2016-01-21 18:02 morein2008 阅读(137) 评论(0) 推荐(0) 编辑
摘要:Java和PyPy运行同一段代码,对比结果. Java代码: package javatest; import java.text.DecimalFormat; import java.util.Date; public class speedTest { public static void ma 阅读全文
posted @ 2016-01-20 20:36 morein2008 阅读(1656) 评论(0) 推荐(0) 编辑
摘要:本例为Python配合BeautifulSoup读取网络图片,并保存在本地。 BeautifulSoup可代替正则表达式,更好地解析Html文本,获取其中的指定内容,如Tag、Property等 # -*- coding: gbk -*- import urllib import urllib2 f 阅读全文
posted @ 2016-01-20 20:11 morein2008 阅读(918) 评论(0) 推荐(0) 编辑
摘要:本例用到了多线程、时间函数、网络流、文件读写、正则表达式(在读取html内容response时,最好不要用正则表达式来抓捕html文本内容里的特征,因为服务器返回的多个页面的文本内容不一定使用相同的模式),是一个综合性的实例。 阅读全文
posted @ 2016-01-20 19:53 morein2008 阅读(1828) 评论(0) 推荐(0) 编辑
摘要:# -*- coding: gbk -*- import re #将数字格式化为带三位数逗号的字符串 def formatNumber(number): numStr='%d'%number formatStr='' numStr=numStr[::-1] i=0 while i<len(numSt 阅读全文
posted @ 2016-01-20 19:29 morein2008 阅读(2799) 评论(0) 推荐(0) 编辑
摘要:package javatest; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io. 阅读全文
posted @ 2016-01-20 19:29 morein2008 阅读(225) 评论(0) 推荐(0) 编辑
摘要:package javatest; import java.text.SimpleDateFormat; import java.util.Date; class timeTest{ public static void main(String[] args){ //获取当前时间 Date star 阅读全文
posted @ 2016-01-20 19:18 morein2008 阅读(134) 评论(0) 推荐(0) 编辑
摘要:测试条件: Java版本: Java 8, .NET版本:v4.0, Release模式,针对x86平台优化 单线程模式。 测试1:(测试1的代码摘自http://blog.csdn.net/houjin_cn/article/details/5957432) Java代码: package jav 阅读全文
posted @ 2016-01-19 15:13 morein2008 阅读(7162) 评论(0) 推荐(0) 编辑
摘要:Java和Python运行速度对比:同一个函数运行一百万次,Java耗时0.577秒,Python耗时78秒--135倍的差距。 版本:Java 8,Python 2.7.10 Java测试代码: import java.util.Date; public class test { public s 阅读全文
posted @ 2016-01-18 16:06 morein2008 阅读(2543) 评论(0) 推荐(0) 编辑
摘要:python的类内部定义的变量 ,形式上没有区分实例变量和类变量(java的静态变量),测试结果如下: 阅读全文
posted @ 2016-01-16 18:56 morein2008 阅读(170) 评论(0) 推荐(0) 编辑
摘要:为何没有删除列表中的全部元素? 解释: 按照执行顺序,第一个空格被删除之后,后面的元素会前移(变成['空格','空格','12','23']),指针下一次会指向新列表的第二个元素(即初始状态的第三个空格),从而初始状态的第二个空格被跳过了,初始第三个空格被删除,接着后面的元素又再次前移(变成['空格 阅读全文
posted @ 2016-01-04 17:36 morein2008 阅读(2143) 评论(0) 推荐(1) 编辑
摘要:python中import和from...import...的区别: 只用import时,如import xx,引入的xx是模块名,而不是模块内具体的类、函数、变量等成员,使用该模块的成员时需写成xx.成员。而from xx import yy(*),xx表示模块,yy表示xx模块的yy成员(*表示 阅读全文
posted @ 2016-01-02 10:03 morein2008 阅读(278) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示