摘要:
Git下载链接:https://git-scm.com/downloads Git小乌龟下载链接:https://tortoisegit.org/download/ 语言包下载链接:https://tortoisegit.org/download/ 版本控制: Git-2.13.0-64-bit.e 阅读全文
摘要:
本文涉及拉链表的理论知识Slowly Changed Dimension(缓慢渐变维) 数仓Data WareHouse 是么是数仓? 数据仓库是面向分析的集成化数据平台,分析的结果给企业提供决策支持。 数仓的应用场景是什么? 满足企业中所有数据的统一化存储,通过规范化的数据处理来实现企业的数据分析 阅读全文
摘要:
Interview Summary 1,请简述你常用的Linux命令. # df -h, free... 2. 大数据的特点是什么? # 5V(大多值快信) 3. namenode是如何管理datanode的? # 心跳机制, 副本机制, 负载均衡. 4. HDFS的默认副本数是3, 那么这3个副 阅读全文
摘要:
MapReduce原理 问题1. 什么是计算, 什么是分布式计算? 答案: 计算指的是从海量数据中提取出有效的价值信息的过程(广义上解释), 狭义上指的是 1 + 1 = 2 即: 数学运算. 分布式计算指的是 多台机器协调, 共同完成同1个计算任务. 问题2: 分布式计算的两种模式? 答案: 分散 阅读全文
摘要:
Kettle使用教程 Kettle是什么 kettle原本是水壶的意思,是可以将一种类型的数据转换为另一种类型的数据,还可以对同种类型的数据进行筛选,分表操作。 对于企业或行业应用来说,经常会遇到各种数据的处理,转换,迁移,掌握一种ETL工具的使用,必不可少,这篇文章介绍的ETL工具是Kettle, 阅读全文
![Kettle使用教程](https://img2023.cnblogs.com/blog/2088113/202305/2088113-20230510224512096-771872187.png)
摘要:
FineBI使用教程 什么是FineBI FineBI是一款数据可视化的软件,使用方式就是点点点。(好的,教程结束!/狗头) 其实,FineBI是一款免费的国内软件。图形化界面做的非常优秀,将数据进行可视化展示只需要拖拽,点击就可以轻松实现。 主要是说,以后用到图形化展示的场合肯定很多,用到Fine 阅读全文
![FineBI使用教程](https://img2023.cnblogs.com/blog/2088113/202305/2088113-20230510195254245-825492291.png)
摘要:
VMware安装 VMware安装步骤for Windows 傻瓜式安装, 下一步下一步即可,再不会直接百度 细节: 优先装VM16, 其次VM15(如果开机蓝屏, 换版本即可), 本质没太大区别 验证成功 去你的windows网络连接中, 能看到 VMNet1 和 VMNet8两个网卡即可 Vmw 阅读全文
摘要:
Class类学习 学习类,以及类的有关方法,都基本到了这门语言语法的末尾章节了。类相较于其他知识点也是比较难理解的。如构造方法,类的继承,多态。 1,类的构造方法 1,构建类的方法的时候会自动执行 2,构建类对象的传参会传递给构造方法 3,构造方法可以给类的成员变量赋值 写法 __init__(se 阅读全文
摘要:
爬虫Spider 该爬虫分为两部分,分别为Spider.py和model.py Spider.py 该文件主要业务逻辑是调用Selenium来通过自动化测试的方法实现模拟人的行为来对网页进行请求,并将请求到的HTML提取为文本,为后续的数据抽取做铺地。需要的第三方工具包Selenium,scrapy 阅读全文
摘要:
注意,该项目为Python基础语法的一个综合,项目数据库。 #学员管理系统 """ 学员管理系统 1. 系统简介 需求:进入系统显示系统功能界面,功能如下: 1、添加学员 2、删除学员 3、修改学员信息 4、查询学员信息 5、显示所有学员信息 6、退出系统 系统共6个功能,用户根据自己需求选取。 " 阅读全文