05 2022 档案
摘要:导入csv库、matplotlib库 import csv import matplotlib.pyplot as plt 定义文件路径 path = r"score.csv" 以只读的形式打开文件 stream = open(path, 'r') 读取文件内容 data = csv.reader(
阅读全文
摘要:Hbase单机版安装 hbase介绍 HBase – Hadoop Database是一个分布式的、面向列的开源数据库,该技术来源于Chang et al所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File Syste
阅读全文
摘要:需要环境(打开cmd输入命令即可安装): pip install numpy pip install pandas pip install matplotlib pip install seaborn 代码一 点击查看代码 import numpy as np import pandas as pd
阅读全文
摘要:原始数据: Map阶段 1.每次读一行数据, 2.拆分每行数据, 3.每个单词碰到一次写个1 <0, "hello tom"> <10, "hello jerry"> <22, "hello kitty"> ❤️4, "hello world"> <46, "hello tom"> 点击查看代码 /
阅读全文
摘要:思维导图大纲 下面我将根据思维导图来复习 MySQL基本数据类型 常见的其实就分为3种: 字符串: char[字符型],varchar[可变字符型] 数值型: int[整数型],bigint[长整型],float[小数型] 日期型: date[日期型],DATETIME[时间日期型],TIMESTA
阅读全文
摘要:网络爬虫、Pandas Pandas 是 Python 语言的一个扩展程序库,用于数据分析。 Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。 Pandas 名字衍生自术语 "panel data"(面板数据)和 "Python data analysi
阅读全文
摘要:MySQL、索引优化&参数优化MySQL、索引优化&参数优化 1.对查询进行优化 应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断, 否则将导致引擎放弃使用索引而进行全表扫描,如: select
阅读全文