01 2015 档案

linux后台运行程序(secureCRT断掉或关闭后继续运行程序)
摘要:secureCRT断掉后想继续运行程序。也就是程序会在后台一直执行到结束。 secureCRT通过ssh联接到client端运行程序,如果关掉窗口或者断开连接时,任务会被kill。 为了程序能够后台执行到结束: 1.可以用&: 比如 python test.py 改成 python tes... 阅读全文

posted @ 2015-01-30 18:48 代码王子 阅读(1009) 评论(0) 推荐(0) 编辑

python脚本程序,传入参数*要用单引号'*'
摘要:*号作为python脚本的传入参数时,必须用单引号'',才能正确传入。如python test.py 2014 '*' age python test.py 2014 * age是错误的。 比如 test.py脚本如下 import sys hdfs_report_historical... 阅读全文

posted @ 2015-01-30 17:53 代码王子 阅读(1792) 评论(0) 推荐(0) 编辑

mysql的left jion:就是left outer join(right join同理)
摘要:左外连接: A left jion B on A.id=B.id 就是A表数据不动,将B表里面能和A对应上的数据补充到A表数据后 而右外连接: rignt jion 则是将A补充到B,B不动,保存全部。 left jion就是left outer join,是简写。 例子: select ... 阅读全文

posted @ 2015-01-28 17:08 代码王子 阅读(305) 评论(0) 推荐(0) 编辑

hive支持in用法是从0.3.2版本后
摘要:写hive 用in 如分时段,分类型,分平台统计点击量 select substr(createtime,12,2) hour,logtype,os_id,count(*) from wizad_mdm_raw_hdfs raw where ad_id in ('19829','19830'... 阅读全文

posted @ 2015-01-28 16:50 代码王子 阅读(247) 评论(0) 推荐(0) 编辑

看人装X,我就来气,开启极限装X模式
摘要:本文书写,纯属扯淡,请勿观看 4进制比二进制更合理,在01的状态中添加了两种状态,从无到有和从有到无的两种过度状态。 如果非要用数值表示,用概率表示。01作为近代计算机的基础,但终究淘汰,构成下一代计算机的基础,应该是3进制或者是4进制。 有人说四进制是这种形式:有到无,最终还是无... 阅读全文

posted @ 2015-01-23 11:13 代码王子 阅读(219) 评论(0) 推荐(0) 编辑

2014年工作总结
摘要:即将农历新年了,意味着传统意义上的2014年也就要成为历史了,这里总结一下2014年工作生活吧: 一、工作方面: 2014年是穿戴式医疗设备概念萌芽的一年,也是医疗设备行业、医疗服务行业快速发展的一年吧。信息技术迅速发展,并把触角伸向了极为保守、传统的医疗行业,也带给了普通人就业、发展的机会... 阅读全文

posted @ 2015-01-22 21:35 代码王子 阅读(99) 评论(0) 推荐(0) 编辑

Hadoop的运行痕迹
摘要:http://www.cnblogs.com/forfuture1978/archive/2010/11/23/1884967.html 一篇讲的很好的 hadoop 基本运行环境配置信息 阅读全文

posted @ 2015-01-21 12:05 代码王子 阅读(79) 评论(0) 推荐(0) 编辑

hashmap简单实例(个人使用经验)
摘要:一、HashMap是错误的:因为int是基本类型,而key和value要求是对象,所以要用Integer而不是int。HashMap的value一定要是Object类型。 二、HashMap同一元素添加二次覆盖 HashMap test = new HashMap(); ... 阅读全文

posted @ 2015-01-16 11:26 代码王子 阅读(1961) 评论(0) 推荐(0) 编辑

python的operator.itemgetter('click')用于定义获取'click'项的函数
摘要:python的排序参见文章http://blog.csdn.net/longshenlmj/article/details/12747195 这里介绍 import operator模块 operator的itemgetter函数用于获取传入参数中某个域的值,如 a = [1,2,3]... 阅读全文

posted @ 2015-01-14 16:44 代码王子 阅读(103) 评论(0) 推荐(0) 编辑

linux的wc -l 命令统计文件少一行(一般是windows文件)
摘要:先简单介绍 wc(Word Count)命令的功能为统计指定文件中的字节数、字数、行数,并将统计结果显示输出 格式:wc file 命令参数: -c 统计Bytes数(字节数),并显示文件名 -l 统计行数:使用换行符‘\n’作为行结束标志,实际是统计换行符个数 -m 统计字符数。这个标志不能与... 阅读全文

posted @ 2015-01-14 11:57 代码王子 阅读(2462) 评论(0) 推荐(0) 编辑

hadoop cdh5的pig隐式转化(int到betyarray)不行了
摘要:cdh3上,pig支持int到chararray的隐式转化,但到cdh5不行。 pig code is as follows: %default Cleaned_Log /user/usergroup_mdmp/test/cleaned/2015-01-05/5/part-r-00000 %d... 阅读全文

posted @ 2015-01-12 17:43 代码王子 阅读(156) 评论(0) 推荐(0) 编辑

贝叶斯定理与朴素贝叶斯分类器
摘要:今天,咱也来任性地扒一扒贝叶斯分类器的那些事儿 朴素贝叶斯由于其简单易用、易于理解的特点,已经广泛应用于文本分类、医疗诊断的应用场景。下面就简单总结一下朴素贝叶斯分类器中的相关知识点: 一、贝叶斯定理: 朴素贝叶斯分类器是一种统计学的分类方法,其基于朴素贝叶斯定理,给定一个样... 阅读全文

posted @ 2015-01-07 19:53 代码王子 阅读(317) 评论(0) 推荐(0) 编辑

我所见过最全的互联网广告相关介绍
摘要:http://dirlt.com/computational-advertising.html#sec-1-9-2-2 阅读全文

posted @ 2015-01-07 17:47 代码王子 阅读(105) 评论(0) 推荐(0) 编辑

使用Python做简单的字符串匹配
摘要:由于需要在半结构化的文本数据中提取一些特定格式的字段、数据辅助挖掘分析工作,以往都是使用Matlab工具进行结构化数据处理的建模,matlab擅长矩阵处理、结构化数据的计算,Python具有与matlab共同的特点:语法简洁、库丰富,对算法仿真来说都是一门简洁易用的语言。 Pytho... 阅读全文

posted @ 2015-01-04 21:21 代码王子 阅读(432) 评论(0) 推荐(0) 编辑

awk:快速入门(简单实用19例+鸟哥书内容)
摘要:awk 用法:awk ' pattern {action} ' 变量名 含义 ARGC 命令行变元个数 ARGV 命令行变元数组 FILENAME 当前输入文件名 FNR 当前文件中的记录号 FS 输入域分隔符,默认为一个空格 RS 输入记录分隔符 NF 当前记录里域个数 ... 阅读全文

posted @ 2015-01-04 16:39 代码王子 阅读(181) 评论(0) 推荐(0) 编辑

聚类算法小结
摘要:一、聚类:聚类也称之为自动分类,是一种无监督的学习方法。算法的原则是基于度量数据对象之间的相似性或相异性,将数据对象集划分为多个簇;相比较于分类技术,聚类只需要较少的专家知识(领域知识),就可以自动发掘数据集中的群组。 二、基本的聚类方法包括: 1、划分方法:该方法通常基于距离使用迭代重定位技术... 阅读全文

posted @ 2015-01-02 14:55 代码王子 阅读(143) 评论(0) 推荐(0) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示