04 2018 档案

摘要:一、Hadoop提供的Shell命令完成相同任务: 1、在本地Linux文件系统的“/home/hadoop/”目录下创建一个文件txt,里面可以随意输入一些单词. 2、在本地查看文件位置(ls) 3、在本地显示文件内容 1 2 3 cd /usr/local/hadoop touch test.t 阅读全文
posted @ 2018-04-27 21:25 083许锦添 阅读(139) 评论(0) 推荐(0) 编辑
摘要:#!/usr/bin/env python # -*- coding: utf-8 -*- # @Author : Woolei# @File : book136_singleprocess.py import requestsimport timeimport osfrom bs4 import 阅读全文
posted @ 2018-04-24 10:23 083许锦添 阅读(992) 评论(0) 推荐(0) 编辑
摘要:import requests import re import pandas from bs4 import BeautifulSoup from datetime import datetime def getPageN(pageUrl): res1 = requests.get(pageUrl) res1.encoding = "utf-8" soup = ... 阅读全文
posted @ 2018-04-17 20:47 083许锦添 阅读(129) 评论(0) 推荐(0) 编辑
摘要:1.用正则表达式判断邮箱是否输入正确 2.用正则表达式识别出全部的电话号码(这里用的是固话模式) 3.用正则表达式进行英文单词的分词 import re ''' 1.用正则表达式判断邮箱是否输入正确 2.用正则表达式识别出全部的电话号码(这里用的是固话模式) 3.用正则表达式进行英文单词的分词 '' 阅读全文
posted @ 2018-04-11 19:07 083许锦添 阅读(166) 评论(0) 推荐(0) 编辑
摘要:import requests from bs4 import BeautifulSoup from datetime import datetime url = "http://news.gzcc.cn/html/xiaoyuanxinwen/" res = requests.get(url) res.encoding = "utf-8" soup = BeautifulSoup(res.... 阅读全文
posted @ 2018-04-03 21:43 083许锦添 阅读(97) 评论(0) 推荐(0) 编辑