上一页 1 2 3 4 5 6 ··· 10 下一页
摘要: 1.使用方法 在hive中加载jar包,调用udf函数 select '江XX',getLastName('江XX') from dual; 2.UDF开发 阅读全文
posted @ 2018-07-23 10:41 Blue眼泪2016 阅读(919) 评论(0) 推荐(0) 编辑
摘要: 1.Python脚本规范基础模板 阅读全文
posted @ 2018-06-30 15:11 Blue眼泪2016 阅读(368) 评论(0) 推荐(0) 编辑
摘要: 1.准备国家的json数据 将准备好的json数据放在指定的目录下,此处可以重这里下载 2.测试编写python脚本处理json提取字段值 3.读取文本循环遍历提取字段值 4.最终处理数据结果 CSV格式: Excel格式: 阅读全文
posted @ 2018-06-30 15:01 Blue眼泪2016 阅读(613) 评论(0) 推荐(0) 编辑
摘要: #coding:utf8 #爬取网上车市[http://www.cheshi.com/]的数据 import requests, json, time, re, os, sys, time,urllib2,shutil,string import threading import MySQLdb import redis from pyquery import PyQuery as pq fro... 阅读全文
posted @ 2018-03-13 11:02 Blue眼泪2016 阅读(642) 评论(0) 推荐(0) 编辑
摘要: Oracle执行计划 阅读全文
posted @ 2018-02-26 11:23 Blue眼泪2016 阅读(143) 评论(0) 推荐(0) 编辑
摘要: Python常用功能函数汇总 1.按行写字符串到文件中 2.创建初始化浏览器 其中,获取网页html 3.根据url获取网页Html函数 4.获取时间的不同格式 5.连接Mysql执行sql语句 阅读全文
posted @ 2018-02-13 08:49 Blue眼泪2016 阅读(446) 评论(0) 推荐(0) 编辑
摘要: Python实现Knn算法 关键词:KNN、K-近邻(KNN)算法、欧氏距离、曼哈顿距离 KNN是通过测量不同特征值之间的距离进行分类。它的的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常是不大于20的整数。KNN算法 阅读全文
posted @ 2018-02-11 15:44 Blue眼泪2016 阅读(658) 评论(0) 推荐(0) 编辑
摘要: Python爬虫基础 1.获取网页文本 通过urllib2包,根据url获取网页的html文本内容并返回 或者 再添加ua和超时时间: 添加header属性: 添加随机ua 阅读全文
posted @ 2018-02-11 09:57 Blue眼泪2016 阅读(2533) 评论(0) 推荐(0) 编辑
摘要: Python面向对象 阅读全文
posted @ 2018-02-08 21:59 Blue眼泪2016 阅读(215) 评论(0) 推荐(0) 编辑
摘要: Shell脚本模板 Shell日期参数 阅读全文
posted @ 2018-01-05 21:18 Blue眼泪2016 阅读(266) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 10 下一页