记得关月亮 - 博客园

2025年2月13日

2025.1.18（周六）

摘要：当数据量达到上亿条时，传统的计算方式可能会变得非常慢，学习Spark就显得尤为重要。Spark通过并行计算显著加速了数据处理。使用Spark时，常见的问题是如何处理大规模数据并高效分配计算任务。如何在Spark中进行数据处理和计算： from pyspark.sql import SparkSes 阅读全文

posted @ 2025-02-13 19:28 记得关月亮阅读(1) 评论(0) 推荐(0) 编辑

2025.1.17（周五）

摘要：学习机器学习时，最常见的入门算法是线性回归。初学者通常会遇到模型过拟合、欠拟合等问题。为了解决这些问题，我们需要理解模型评估指标，并进行适当的正则化。如何使用Python实现线性回归，并评估模型： from sklearn.model_selection import train_test_spl 阅读全文

posted @ 2025-02-13 19:27 记得关月亮阅读(1) 评论(0) 推荐(0) 编辑

2025.1.16（周四）

摘要：数据清洗是数据分析中的第一步，通常我们会遇到缺失值、格式不统一等问题。例如，在处理时间格式时，数据中的时间可能是字符串形式，且格式不一致。 import pandas as pd # 假设数据中有时间列'order_date'，其格式为字符串 data = pd.read_csv('orders.c 阅读全文

posted @ 2025-02-13 19:27 记得关月亮阅读(1) 评论(0) 推荐(0) 编辑

2025.1.15（周三）

摘要： SQL是大数据分析中的基本技能之一。在学习SQL时，很多人会遇到如何优化查询速度和处理大量数据的问题。特别是在使用大数据存储（如MySQL、PostgreSQL等）时，SQL查询可能会非常慢。优化sql查询： -- 创建索引来加速查询 CREATE INDEX idx_column_name ON 阅读全文

posted @ 2025-02-13 19:26 记得关月亮阅读(1) 评论(0) 推荐(0) 编辑

2025.1.14（周二）

摘要：学习Python数据分析时，Pandas是你必须掌握的工具。初学者常遇到的问题是，如何高效地清洗和处理数据，特别是如何处理缺失值和重复数据。删除重复数据： import pandas as pd # 读取数据 data = pd.read_csv('data.csv') # 查看数据的缺失值 pr 阅读全文

posted @ 2025-02-13 19:24 记得关月亮阅读(1) 评论(0) 推荐(0) 编辑

2025.1.13（周一）

摘要：选择Python学习大数据，因为它简单易学，并且有强大的数据分析库。最初的问题是，如何处理大型数据集，尤其是那些不能直接加载到内存中的数据。常见的处理方式是使用“批处理”，这时可以利用Pandas和Dask等工具进行内存外计算。 import pandas as pd # 使用chunk_size逐阅读全文

posted @ 2025-02-13 19:24 记得关月亮阅读(2) 评论(0) 推荐(0) 编辑

2024年12月25日

本学期奖励加分项

摘要：内容：成功搞到对象阅读全文

posted @ 2024-12-25 10:28 记得关月亮阅读(13) 评论(0) 推荐(0) 编辑

2024.12.27（周五）

摘要： <!DOCTYPE html> <html lang="en"> <head> <meta charset="utf-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="wi 阅读全文

posted @ 2024-12-25 10:23 记得关月亮阅读(2) 评论(0) 推荐(0) 编辑

2024.12.26（周四）

摘要： <!DOCTYPE html> <html lang="en"> <head> <meta charset="utf-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="wi 阅读全文

posted @ 2024-12-25 10:23 记得关月亮阅读(4) 评论(0) 推荐(0) 编辑

2024.12.25（周三）

摘要： <!DOCTYPE html> <html lang="en"> <head> <meta charset="utf-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="wi 阅读全文

posted @ 2024-12-25 10:22 记得关月亮阅读(4) 评论(0) 推荐(0) 编辑

Sunyiran

公告