会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Liang
博客园
首页
新随笔
联系
订阅
管理
随笔 - 63 文章 - 0 评论 - 8 阅读 -
26万
2021年10月10日
Hive元数据信息对应Msql表
摘要: Hive学习之路 (三)Hive元数据信息对应MySQL数据库表 转载自:Hive学习之路 (三)Hive元数据信息对应MySQL数据库表 - 扎心了,老铁 - 博客园 (cnblogs.com) 目录 概述 一、存储Hive版本的元数据表(VERSION) 二、Hive数据库相关的元数据表(DBS
阅读全文
posted @ 2021-10-10 21:48 liangxb
阅读(188)
评论(0)
推荐(0)
编辑
2021年1月27日
虚拟机能ping通,但是telnet某个端口却不行
摘要: 问题描述:本机去ping虚拟机能ping通,然后telnet虚拟机的22端口也可以,但是telnet 22122 端口却连接不上。 问题产生原因:虚拟机中的防火墙没有关闭,其中80端口是访问的(但是为啥22端口可以访问,我还没弄明白) 你可以查看一下防火墙下可以访问的端口: firewall-cmd
阅读全文
posted @ 2021-01-27 23:24 liangxb
阅读(2710)
评论(0)
推荐(0)
编辑
2019年4月30日
大数据用户画像方法与实践(干货 转帖)
摘要: 在大数据时代,机器要学会从比特流中解读用户,构建用户画像就变得尤其重要。本文介绍了用户画像的理论和实践,以及在实际中的应用。如何根据用户画像进行精准营销?将用户画像应用于个性化推荐?一起来寻找答案吧~ 首先看一下大数据与应用画像的关系,现在大数据是炙手可热,相信大家对大数据的四个V都非常了解,大数据
阅读全文
posted @ 2019-04-30 14:10 liangxb
阅读(5313)
评论(0)
推荐(0)
编辑
2019年3月2日
Scrapy实战篇(九)之爬取链家网天津租房数据
摘要: 以后有可能会在天津租房子,所以想将链家网上面天津的租房数据抓下来,以供分析使用。 思路: 1、以初始链接https://tj.lianjia.com/zufang/rt200600000001/?showMore=1(因为我只关心整租的房间)开始,首先获取每个行政区对应的链接。 2、在以每个区的链接
阅读全文
posted @ 2019-03-02 19:14 liangxb
阅读(701)
评论(0)
推荐(0)
编辑
2019年3月1日
Scrapy实战篇(八)之爬取教育部高校名单抓取和分析
摘要: 本节我们以网址https://daxue.eol.cn/mingdan.shtml为初始链接,爬取教育部公布的正规高校名单。 思路: 1、首先以上面的地址开始链接,抓取到下面省份对应的链接。 2、在解析具体的省份源代码,获取数据。虽然山东和河南的网页结构和其他不同,我们也不做特殊处理,直接不做抓取即
阅读全文
posted @ 2019-03-01 18:27 liangxb
阅读(1560)
评论(1)
推荐(0)
编辑
2019年2月16日
Scrapy实战篇(七)之爬取爱基金网站基金业绩数据
摘要: 本篇我们以scrapy+selelum的方式来爬取爱基金网站(http://fund.10jqka.com.cn/datacenter/jz/)的基金业绩数据. 思路:我们以http://fund.10jqka.com.cn/datacenter/jz/网站作为起始,首先抓取页面中基金的详细页面地址
阅读全文
posted @ 2019-02-16 23:45 liangxb
阅读(1124)
评论(0)
推荐(0)
编辑
Selenium常用方法
摘要: Selenium是一个自动化测试工具,利用它可以驱动浏览器执行特定的动作,如点击、下拉等操作,同时还可以获取浏览器当前呈现的页面的源代码,做到可见即可爬。对于一些JavaScript动态渲染的页面来说,此种抓取方式非常有效。本节中,就让我们来感受一下它的强大之处吧。 1. 准备工作 本节以Chrom
阅读全文
posted @ 2019-02-16 23:29 liangxb
阅读(5315)
评论(0)
推荐(1)
编辑
Selenium之动作链(ActionChains)
摘要: 用selenium做自动化,有时候会遇到需要模拟鼠标操作才能进行的情况,比如单击、双击、点击鼠标右键、拖拽等等。而selenium给我们提供了一个类来处理这类事件——ActionChains selenium.webdriver.common.action_chains.ActionChains(d
阅读全文
posted @ 2019-02-16 23:19 liangxb
阅读(24253)
评论(0)
推荐(5)
编辑
2019年2月13日
scrapy实战之scrapyrt的使用
摘要: scrapyrt为scrapy提供了一个http接口,有了它,我们不用再执行命令,而是直接请求一个http接口来启动项目,如果项目是部署在远程的,会比较方便。 1、安装: pip install scrapyrt 2、在任意一个项目中运行scrapyrt,再此我们在quotes爬虫项目中运行。默认会
阅读全文
posted @ 2019-02-13 22:42 liangxb
阅读(2174)
评论(0)
推荐(0)
编辑
Scrapy实战篇(六)之爬取360图片数据和图片
摘要: 本篇文章我们以360图片为例,介绍scrapy框架的使用以及图片数据的下载。 目标网站:http://images.so.com/z?ch=photography 思路:分析目标网站为ajax加载方式,通过构造目标url从而请求数据,将图片数据存储在本地,将图片的属性存储在mongodb中。 1、首
阅读全文
posted @ 2019-02-13 22:04 liangxb
阅读(1753)
评论(0)
推荐(0)
编辑
下一页
昵称:
liangxb
园龄:
11年6个月
粉丝:
35
关注:
1
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
敏捷软件开发
(7)
powerdesigner
(3)
hadoop
(3)
hbase
(2)
数据建模
(2)
数据仓库
(2)
大数据
(2)
ssh
(1)
Scrapy
(1)
reduce
(1)
更多
随笔分类
Database(4)
Hadoop(10)
Linux(2)
Python常见问题(3)
python爬虫-Scrapy(24)
Selenium(2)
敏捷软件开发(7)
数据仓库(9)
数据挖掘(1)
银行业法律法规与综合能力(1)
随笔档案
2021年10月(1)
2021年1月(1)
2019年4月(1)
2019年3月(2)
2019年2月(26)
2019年1月(1)
2018年10月(9)
2018年9月(1)
2018年8月(2)
2018年7月(5)
2018年6月(1)
2018年5月(3)
2018年3月(7)
2017年12月(3)
阅读排行榜
1. PowerDesigner最基础的使用方法入门学习(一)(45910)
2. ssh 登录出现的几种错误以及解决办法(33839)
3. 漫谈数据仓库之拉链表(原理、设计以及在Hive中的实现)(31872)
4. Selenium之动作链(ActionChains)(24253)
5. 数据仓库建模(22086)
评论排行榜
1. PowerDesigner最基础的使用方法入门学习(一)(3)
2. 数据仓库与ODS(2)
3. Scrapy实战篇(八)之爬取教育部高校名单抓取和分析(1)
4. Scrapy实战篇(二)之爬取链家网成交房源数据(下)(1)
5. 漫谈数据仓库之拉链表(原理、设计以及在Hive中的实现)(1)
推荐排行榜
1. PowerDesigner最基础的使用方法入门学习(一)(21)
2. 漫谈数据仓库之拉链表(原理、设计以及在Hive中的实现)(7)
3. Selenium之动作链(ActionChains)(5)
4. 数据仓库建模(2)
5. ssh 登录出现的几种错误以及解决办法(2)
最新评论
1. Re:Scrapy实战篇(二)之爬取链家网成交房源数据(下)
【体验入口】 小区名称、价格、地区、地址、商圈、标签、经纬度、 物业类型、交易权属、竣工时间、产权年限、开发商、 总户数、总建面积、绿化率、容积率、统一供暖 供水供电、 停车位、停车费、物业费、物业公...
--糖水泡果子
2. Re:ssh 登录出现的几种错误以及解决办法
ssh: Could not resolve hostname devcloud: \262\273\326\252\265\300\325\342\321\3 71\265\304\326\367\...
--cdcdcdcd
3. Re:数据仓库与ODS
ods用一般数据库来做吗? 数据仓库一般用啥
--变形精怪
4. Re:PowerDesigner最基础的使用方法入门学习(一)
非常棒的文章!非常详细,感谢博主!!
--敲代码的小浪漫
5. Re:漫谈数据仓库之拉链表(原理、设计以及在Hive中的实现)
讲解详细,学习啦!
--tesla414
点击右上角即可分享