数据集:数据对象的集合属性(attribute)是对象的性质或特性,它因对象而异,或随时间而变化。测量标度(measurement scale)是将数值或符号值与对象的属性相关联的规则(函数)属性的不同类型: 标称:标称属性的值仅仅只是不同的名字,即标称值只提供足够的信息以区分对象。比如:邮政编码... Read More
最近在自学数据挖掘的知识,看的教材是《数据挖掘导论(完整版)》Pang-Ning Tan 著 。为了更好的归纳总结,开一系列DM的帖子,记录书中的重点和自己的心得。数据挖掘(Data Mining)是一种技术,将传统的数据分析方法与处理大量数据的复杂算法相结合,现阶段主要用来支持商务智能(Busin... Read More
五一在家,VPN不能链接了,而项目在本地run的过程中,又需要链接公司的SSO server才能login。下雨,不想去公司,又不得不在家做task,只能想办法避开SSO login,以前知道django自带的有login模块,就打算用它暂时替换掉项目本身的login模块,这样就能绕过SSO验证,就... Read More
前几天向几位新同事介绍项目,被问起了@login_required的实现,我说这是django框架提供的装饰器方法,验证用户是否登录,只要这样用就行了,因为自己不熟,并没有做过多解释。 今天查看django官网,忽然发现,装饰器用法并不是django框架提供的,而是python的一种语法,真心汗一个 Read More
上周一个新的应用场景,带出来了关于django session管理的问题。公司的另一个App以Widget的形式嵌入我们的页面,就是我们提供一些url,另一个App通过iframe的形式嵌入这些url的respone页面到自己的页面中。QA发现,当两个App都session timeout后,重新s... Read More
最近改进了项目中的站内搜索的功能,增加了全文索引,提升了搜索速度。因为项目框架是django,所以采用django+haystack+pyelasticsearch+elasticsearch的方式实现。django作为Web framework,采用MVC设计模式,非常易于开发数据库驱动的网站。h... Read More
去上海参加了两天的培训。第一天在公司培训听了一系列的演讲,都是介绍公司各部门情况的,没啥意思。第二天去吴江的某个实训基地参加了一个比较正规的素质拓展。第一次以新员工的身份参加这类的活动,来参加培训的也是刚刚毕业半年到一年之间的年轻人,大家都知道素质拓展基本就是分组合作玩游戏,基本上都抱着来玩儿的态度... Read More
最近两周一直在加班加点refactor代码,贡献了2014年最后一个周末和2015年元旦三天假期,终于赶在了sprint结束之前完成。可见,这个sprint做的并不理想!项目逻辑本身并不复杂,从数据库取数据,进行相关分析计算,然后在前端以图表的形式呈现结果。用的是Django框架,前端图形采用jqp... Read More