摘要:
思维导图大纲 下面我将根据思维导图来复习 MySQL基本数据类型 常见的其实就分为3种: 字符串: char[字符型],varchar[可变字符型] 数值型: int[整数型],bigint[长整型],float[小数型] 日期型: date[日期型],DATETIME[时间日期型],TIMESTA 阅读全文
摘要:
导入csv库、matplotlib库 import csv import matplotlib.pyplot as plt 定义文件路径 path = r"score.csv" 以只读的形式打开文件 stream = open(path, 'r') 读取文件内容 data = csv.reader( 阅读全文
摘要:
Hbase单机版安装 hbase介绍 HBase – Hadoop Database是一个分布式的、面向列的开源数据库,该技术来源于Chang et al所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File Syste 阅读全文
摘要:
需要环境(打开cmd输入命令即可安装): pip install numpy pip install pandas pip install matplotlib pip install seaborn 代码一 点击查看代码 import numpy as np import pandas as pd 阅读全文
摘要:
原始数据: Map阶段 1.每次读一行数据, 2.拆分每行数据, 3.每个单词碰到一次写个1 <0, "hello tom"> <10, "hello jerry"> <22, "hello kitty"> ❤️4, "hello world"> <46, "hello tom"> 点击查看代码 / 阅读全文
摘要:
网络爬虫、Pandas Pandas 是 Python 语言的一个扩展程序库,用于数据分析。 Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。 Pandas 名字衍生自术语 "panel data"(面板数据)和 "Python data analysi 阅读全文
摘要:
MySQL、索引优化&参数优化MySQL、索引优化&参数优化 1.对查询进行优化 应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断, 否则将导致引擎放弃使用索引而进行全表扫描,如: select 阅读全文
摘要:
numpy函数 准备工作: pip install numpy 把numpy模块安装好 代码如下: 点击查看代码 import numpy as np # 数组元素字符串连接 print('连接两个字符串:') print(np.char.add(['hello'], ['zmt'])) print 阅读全文
摘要:
Java操作HDFS 准备工作: Hadoop环境变量配置 jdk环境变量配置 不详细演讲 下面直接演示代码:(如下) 点击查看代码 import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; impo 阅读全文
摘要:
MySQL查询优化 USE test; CREATE TABLE IF NOT EXISTS emp ( id INT PRIMARY KEY AUTO_INCREMENT, NAME VARCHAR(20), age INT, salary FLOAT ); #创建存储过程 DELIMITER $ 阅读全文