Blue眼泪2016

2018年7月23日

UDF-java获取名字中的姓

摘要： 1.使用方法在hive中加载jar包，调用udf函数 select '江XX',getLastName('江XX') from dual; 2.UDF开发阅读全文

posted @ 2018-07-23 10:41 Blue眼泪2016 阅读(954) 评论(0) 推荐(0)

2018年6月30日

Python脚本模板

摘要： 1.Python脚本规范基础模板阅读全文

posted @ 2018-06-30 15:11 Blue眼泪2016 阅读(376) 评论(0) 推荐(0)

Python处理json数据--世界国家维度数据

摘要： 1.准备国家的json数据将准备好的json数据放在指定的目录下，此处可以重这里下载 2.测试编写python脚本处理json提取字段值 3.读取文本循环遍历提取字段值 4.最终处理数据结果 CSV格式: Excel格式: 阅读全文

posted @ 2018-06-30 15:01 Blue眼泪2016 阅读(637) 评论(0) 推荐(0)

2018年3月13日

Python爬取网上车市[http://www.cheshi.com/]的数据

摘要： #coding:utf8 #爬取网上车市[http://www.cheshi.com/]的数据 import requests, json, time, re, os, sys, time,urllib2,shutil,string import threading import MySQLdb import redis from pyquery import PyQuery as pq fro... 阅读全文

posted @ 2018-03-13 11:02 Blue眼泪2016 阅读(674) 评论(0) 推荐(0)

2018年2月26日

Oracle执行计划

摘要： Oracle执行计划阅读全文

posted @ 2018-02-26 11:23 Blue眼泪2016 阅读(151) 评论(0) 推荐(0)

2018年2月13日

Python常用功能函数

摘要： Python常用功能函数汇总 1.按行写字符串到文件中 2.创建初始化浏览器其中，获取网页html 3.根据url获取网页Html函数 4.获取时间的不同格式 5.连接Mysql执行sql语句阅读全文

posted @ 2018-02-13 08:49 Blue眼泪2016 阅读(457) 评论(0) 推荐(0)

2018年2月11日

Python实现KNN算法

摘要： Python实现Knn算法关键词：KNN、K-近邻(KNN)算法、欧氏距离、曼哈顿距离 KNN是通过测量不同特征值之间的距离进行分类。它的的思路是：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。K通常是不大于20的整数。KNN算法阅读全文

posted @ 2018-02-11 15:44 Blue眼泪2016 阅读(672) 评论(0) 推荐(0)

Python获取网页Html文本

摘要： Python爬虫基础 1.获取网页文本通过urllib2包，根据url获取网页的html文本内容并返回或者再添加ua和超时时间：添加header属性：添加随机ua 阅读全文

posted @ 2018-02-11 09:57 Blue眼泪2016 阅读(2585) 评论(0) 推荐(0)

2018年2月8日

Python面向对象

摘要： Python面向对象阅读全文

posted @ 2018-02-08 21:59 Blue眼泪2016 阅读(223) 评论(0) 推荐(0)

2018年1月5日

Shell脚本

摘要： Shell脚本模板 Shell日期参数阅读全文

posted @ 2018-01-05 21:18 Blue眼泪2016 阅读(275) 评论(0) 推荐(0)

公告