摘要:
在Python中,我们经常需要读取和处理Excel文件中的数据。openpyxl是一个功能强大的库,可以轻松地实现Excel文件的读写操作。本文将介绍如何使用openpyxl库读取Excel文件中的数据。 1. 导入所需库 首先,我们需要导入openpyxl库,这个库提供了许多用于操作Excel文件 阅读全文
摘要:
需求描述:如何用tableau计算一段连续时间的环比 1、如图所示新建参数《开始时间》 2、如图所示新建参数《结束时间》 3、新建计算字段《本期金额》 IF [订单日期] >= [开始时间] AND [订单日期] <= [结束时间] THEN [销售额]END 4、新建计算字段《上期金额》 IF [ 阅读全文
摘要:
月复购率=当月购买多次的人数/当月购买人数 参考文档:https://help.fanruan.com/finebi/doc-view-1264.html 新建计算字段:月内购买次数 { INCLUDE [客户名称]:COUNTD([订单id])} 新建计算字段:月内购买人数 新建计算字段:月内重复 阅读全文
摘要:
安装Python包的国内镜像源 清华大学 https://pypi.tuna.tsinghua.edu.cn/simple 阿里云 https://mirrors.aliyun.com/pypi/simple/ 豆瓣 https://pypi.douban.com/simple/ 百度云 https 阅读全文
摘要:
新建计算字段:月累计值 DEF_ADD(SUM_AGG(${销售额}),[],[${年份}=EARLIER(${年份}),${月份}<=EARLIER(${月份})]) 新建计算字段:上一年月累计值 DEF_ADD(SUM_AGG(${销售额}),[],[${年份}=EARLIER(${年份}-1) 阅读全文
摘要:
准备工作 在开始之前,确保你的 Python 环境中已经安装了 openpyxl 和 pandas 库。可以使用以下命令进行安装: pip install openpyxl pandas 第一步:编写函数保留表头和第一行数据 我们首先编写一个函数 keep_first_two_rows,用于保留指定 阅读全文
摘要:
月复购率=当月购买多次的人数/当月购买人数 参考文档:https://help.fanruan.com/finebi/doc-view-1264.html 新建计算字段:月内购买次数 DEF_ADD(COUNTD_AGG(${订单ID}),${客户名称}) 新建计算字段:月内购买人数 DEF_ADD 阅读全文
摘要:
写在前面:前段时间遇到一个小需求,需要姓名这一列变成一行数据显示,并用逗号分隔符分隔开 第一种方法:用Excel公式实现 新增一列分隔符,使用concat函数 第二种方法:用MySQL数据库函数公式实现 SELECT GROUP_CONCAT(yonghu.`姓名`) AS concatenated 阅读全文
摘要:
数据分析是指对原始数据进行收集、处理、分析和解读的过程,以得出有用的见解、结论和建议。数据分析的目的是通过了解数据中的模式、趋势和关系,帮助决策者做出更好的决策。数据分析通常涉及多个步骤,包括: 数据收集:从各种来源(如数据库、网络、设备传感器、调查问卷等)收集数据。 数据清洗:清理数据,去除错误数 阅读全文
摘要:
Hadoop是一个开源的分布式计算平台,旨在处理大规模数据的存储和处理。它提供了分布式文件系统(HDFS)和分布式计算框架(MapReduce),使得用户能够在大规模集群上存储和处理数据。Hadoop最初由Apache软件基金会开发,现已成为处理大数据的主流解决方案之一。 Hadoop的核心组件包括 阅读全文
摘要:
2.1 简介 2.2.1 创建Series import pandas as pd # 创建一个包含整数的Series data = pd.Series([1, 3, 5, 7, 'panda']) print(data) # 为Series中的值指定索引 test=pd.Series(['宋江', 阅读全文
摘要:
1.1 简介 Pandas 是 Python 编程语言的一个软件库,用于数据操作和分析。它提供了强大的数据结构,特别是 DataFrame,用于处理结构化数据。DataFrame 类似于电子表格,可以存储多种类型的数据,并支持各种数据操作,包括索引、选择、过滤、合并和聚合数据。Pandas 还提供了 阅读全文
摘要:
1、打开tableau连接本地MySQL-》新建自定义sql-》创建参数 2、新建一个简单的工作表-》把维度拖拽到行显示结果-》右键显示参数 3、参数传递到数据库sql写法 select * from yonghu where yonghu.`姓名` like concat('%',<参数.姓名>, 阅读全文
摘要:
Pandas提取Excel中唯一值的最后数值保存 import pandas as pd # 假设数据保存在Excel文件中,加载数据 df = pd.read_excel(r'C:\\Users\\Administrator\\Desktop\\物料收发明细表_2024011709475312_2 阅读全文
摘要:
Apache Spark是一个开源的大数据处理框架,旨在提供高效、通用和易用的大数据处理引擎。它最初由加州大学伯克利分校AMPLab开发,并于2010年开源。 Spark提供了一个基于内存的计算引擎,可以在大规模数据集上执行高速的数据处理任务。相比传统的MapReduce模型,Spark具有更高的性 阅读全文
摘要:
1、更新索引包在终端中执行以下命令,更新包索引: sudo apt update 2、安装默认JDK版本:在Ubuntu 20.04及以上版本中,默认提供 OpenJDK作为JDK的选择。可以通过以下命令安装OpenJDK: sudo apt install default-jdk 这将安装Open 阅读全文