摘要:
1.使用方法 在hive中加载jar包,调用udf函数 select '江XX',getLastName('江XX') from dual; 2.UDF开发 阅读全文
摘要:
1.Python脚本规范基础模板 阅读全文
摘要:
1.准备国家的json数据 将准备好的json数据放在指定的目录下,此处可以重这里下载 2.测试编写python脚本处理json提取字段值 3.读取文本循环遍历提取字段值 4.最终处理数据结果 CSV格式: Excel格式: 阅读全文
摘要:
#coding:utf8 #爬取网上车市[http://www.cheshi.com/]的数据 import requests, json, time, re, os, sys, time,urllib2,shutil,string import threading import MySQLdb import redis from pyquery import PyQuery as pq fro... 阅读全文
摘要:
Oracle执行计划 阅读全文
摘要:
Python常用功能函数汇总 1.按行写字符串到文件中 2.创建初始化浏览器 其中,获取网页html 3.根据url获取网页Html函数 4.获取时间的不同格式 5.连接Mysql执行sql语句 阅读全文
摘要:
Python实现Knn算法 关键词:KNN、K-近邻(KNN)算法、欧氏距离、曼哈顿距离 KNN是通过测量不同特征值之间的距离进行分类。它的的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。K通常是不大于20的整数。KNN算法 阅读全文
摘要:
Python爬虫基础 1.获取网页文本 通过urllib2包,根据url获取网页的html文本内容并返回 或者 再添加ua和超时时间: 添加header属性: 添加随机ua 阅读全文
摘要:
Python面向对象 阅读全文