摘要: 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语 阅读全文
posted @ 2017-09-25 15:45 RoyFans 阅读(261) 评论(0) 推荐(0) 编辑
摘要: 解决方案: 阅读全文
posted @ 2017-09-22 10:31 RoyFans 阅读(2333) 评论(0) 推荐(0) 编辑
摘要: 1 #encoding=utf-8 2 import requests 3 from bs4 import BeautifulSoup 4 import re 5 import os 6 from aria2rpc import rpc_addUri 7 class Cntv(): 8 9 def openUrl(self,url): 10 ... 阅读全文
posted @ 2017-09-22 09:14 RoyFans 阅读(2301) 评论(1) 推荐(0) 编辑
摘要: 在新安装的Linux系统命令行下, 敲入:ifconfig,显示如下界面。 上面这张图显示网卡没有启动,那么我们敲入代码:ifup eth0启动网卡。 网卡启动后,我们可以看出,IP地址和网关等其他信息都已经出现。 但是我们需要的是静态IP,即不随着时间改变而改变的IP地址。 首先我们要知道我们的网 阅读全文
posted @ 2017-09-20 09:57 RoyFans 阅读(499) 评论(0) 推荐(0) 编辑
摘要: 安装ranger时MySQL报错,查看MySQL数据库,发现host=localhost这一列被删除了,插入这一列就好了,具体操作如下: 解决办法: 进入MySQL数据库 然后重新执行etup.sh 就正常了。 阅读全文
posted @ 2017-09-14 14:35 RoyFans 阅读(9813) 评论(0) 推荐(0) 编辑
摘要: 原因:出现上述问题通常是运行hive 在bin/目录下的脚本所致。 解决办法:就是让HIVE_HOME变量指向hive-trunk/build/dist目录,将$HIVE_HOME/bin添加到PATH变量之后。build/dist 是默认的安装目录。 阅读全文
posted @ 2017-09-13 09:45 RoyFans 阅读(4941) 评论(0) 推荐(0) 编辑
摘要: 解决错误 呈现该错误的原因是当前的GCC版本中,没有GLIBCXX_3.4.15,须要安装更高版本。 我们可以输入:strings /usr/lib/libstdc++.so.6 | grep GLIBCXX,查看当前的GCC版本,成果如下: GLIBCXX_3.4 GLIBCXX_3.4.1 GL 阅读全文
posted @ 2017-09-12 15:15 RoyFans 阅读(734) 评论(0) 推荐(0) 编辑
摘要: 遇到这种情况大家都找不到头绪,是因为你开始运行了hive的metastore,可以输入jps 然后出现如下: 红线所示就是hive metastore的进程 为了重新启动,需要把这个进杀掉; kill -9 pid(这个是哪个程序的进程号) 然后再输入 hive --service metastor 阅读全文
posted @ 2017-09-07 17:53 RoyFans 阅读(1929) 评论(0) 推荐(0) 编辑
摘要: 1 from bs4 import BeautifulSoup 2 import requests 3 import html.parser 4 from openpyxl import Workbook,load_workbook 5 import os 6 class DouBan(object): 7 8 def __init__(self): 9 ... 阅读全文
posted @ 2017-09-04 17:34 RoyFans 阅读(1123) 评论(0) 推荐(0) 编辑
摘要: 一、去除空格 二、替换 replace("space","") 用replace("\n", ""),后边的串替换掉前边的 阅读全文
posted @ 2017-09-04 15:06 RoyFans 阅读(56627) 评论(0) 推荐(2) 编辑
摘要: 摘要: http://www.cloudera.com/content/cloudera-content/cloudera-docs/Impala/latest/Installing-and-Using-Impala/ciiu_langref_sql.html Impala SQL 语言元素(Ele 阅读全文
posted @ 2017-09-01 15:41 RoyFans 阅读(3834) 评论(0) 推荐(0) 编辑
摘要: Beautiful Soup 4.2.0 文档 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间. 这篇文档介绍了Beautifu 阅读全文
posted @ 2017-08-31 10:49 RoyFans 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 快速上手 迫不及待了吗?本页内容为如何入门 Requests 提供了很好的指引。其假设你已经安装了 Requests。如果还没有,去安装一节看看吧。 首先,确认一下: Requests 已安装 Requests 是最新的 让我们从一些简单的示例开始吧。 发送请求 使用 Requests 发送网络请求 阅读全文
posted @ 2017-08-31 10:39 RoyFans 阅读(1153) 评论(1) 推荐(0) 编辑
摘要: from openpyxl import Workbook from openpyxl import load_workbook # 加载workbook,注意,openpyxl只支持xlsx格式 wb = load_workbook(filename=r"C:\\Users\\Administrator\\Desktop\\test.xlsx") '''读取数据''' num = wb.ge... 阅读全文
posted @ 2017-08-24 09:19 RoyFans 阅读(1151) 评论(0) 推荐(0) 编辑
摘要: import requests from bs4 import BeautifulSoup import os class DownLoadImg(object): def __init__(self): self.url = 'http://jandan.net/ooxx/' self.header = { 'User-Agen... 阅读全文
posted @ 2017-08-23 14:18 RoyFans 阅读(412) 评论(0) 推荐(0) 编辑
摘要: #encoding=utf-8 import requests def fanyi(): while True: context = input("请输入翻译的内容(退出q):") if context in ['q','Q']: break else: url = 'http://fan... 阅读全文
posted @ 2017-08-23 14:16 RoyFans 阅读(3886) 评论(4) 推荐(0) 编辑
摘要: 环境相关 系统:CentOS 6.8 64位jdk:1.7.0_79hadoop:hadoop 2.7.2 配置SSH免密码登录 测试下ssh是否可用 安装hadoop2 下载hadoop-2.7.2.tar.gz,放在opt目录下,解压 配置Hadoop,路径/opt/hadoop-2.5.1/e 阅读全文
posted @ 2017-08-21 13:11 RoyFans 阅读(720) 评论(0) 推荐(0) 编辑
摘要: 直接解决方法:在命令行中输入:export PATH=/usr/bin:/usr/sbin:/bin:/sbin:/usr/X11R6/bin 后 Enter 阅读全文
posted @ 2017-08-21 12:43 RoyFans 阅读(1745) 评论(0) 推荐(0) 编辑
摘要: 查看CentOS自带JDK是否已安装。◆输入:yum list installed |grep java。 若有自带安装的JDK,如何卸载CentOS系统自带Java环境?◆卸载JDK相关文件输入:yum -y remove java-1.7.0-openjdk*。◆卸载tzdata-java输入: 阅读全文
posted @ 2017-08-21 10:37 RoyFans 阅读(667) 评论(0) 推荐(0) 编辑
摘要: Hive和Impala作为数据查询工具,它们是怎样来查询数据的呢?与Impala和Hive进行交互,我们有哪些工具可以使用呢? Hive和Impala作为数据查询工具,它们是怎样来查询数据的呢?与Impala和Hive进行交互,我们有哪些工具可以使用呢? 我们首先明确Hive和Impala分别提供了 阅读全文
posted @ 2017-08-17 09:34 RoyFans 阅读(1220) 评论(0) 推荐(0) 编辑