05 2022 档案
摘要:一、需求 本打算使用 Pandas 中的 describe() 函数查看一些数据的分布情况,显示为科学计数法,不方便对比。 data_train[['hold_day','hold_cnt']].describe() ''' hold_day hold_cnt count 1.492277e+06
阅读全文
摘要:一、需求 统计传入的字符串,各个字符的出现次数,返回一个 dict 结果。 二、实操 1.方法1:迭代计算 # 方法一:迭代计算 def char_count(strings: str): result = {} strings = strings.lower() for i in strings:
阅读全文
摘要:PyHive 是 Python 语言编写的用于操作 Hive 的简便工具库。 一、PyHive安装 # Liunx系统 pip install sasl pip install thrift pip install thrift-sasl pip install PyHive # Windows系统
阅读全文
摘要:一、需求 需要查找 DataFrame 中存在特殊字符的行列。 二、实操 可以利用 re 模块中的查找实现该需求。 1.构建测试数据集 import pandas as pd df = pd.DataFrame({ 'id':range(5), 'name':['ABC','-','B*','NA'
阅读全文
摘要:虚拟化技术:物理机时代 → 虚拟机时代 → 容器化时代 Docker 是虚拟化技术不断发展的必然结果。 虚拟机 容器 Docker 这一些都是什么概念??? 1.虚拟机 VMWare、VirtualBox 等软件,可以在电脑上创建一个虚拟机,安装额外的系统,例如:Win7、Win10、Ubuntu
阅读全文
摘要:类似于另外一篇文所讲,仅记录一下代码备用。 Python学习笔记:给定邮编,判断区域 1.需求 提取第1个元素。 2.实操 import pandas as pd df = pd.DataFrame({ 'name':['[abc,123,456]','[abcd,123,456]','[1bcas
阅读全文
摘要:一、需求 生成一个数据框,行数不确定,有两列:a-z循环,1-2循环,可根据需要指定数据行数。 二、实操 # Pandas生成任意行的循环取值数据 import pandas as pd import string import itertools string.ascii_letters # 'a
阅读全文
摘要:一、题目 a 为原始的列表,b 为统计后的结果。 a = [1, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1] b = [0, 1, 2, 0, 1, 2, 0, 1, 0, 0, 1, 2, 3, 4, 5] 二、解答 利用指针的方式,判断前一位与后一位是否相
阅读全文
摘要:一、背景 以前都是用本机自带的 Jupyter Notebook(Anaconda3) 直接打开服务,会自动弹出浏览器,并可进行 Python 编程。 所弹出的浏览器地址为:localhost:, 无法分享给局域网内其他电脑访问。 遂折腾一番。 二、无界面启动 打开 cmd 执行以下命令。 # 获取
阅读全文