摘要: 因为详细的数据分析在之前的文章中已经做过,而且这次重新爬取数据主要也是为了比较一下广州二手房市场的一些新变化,所以完整且详细的分析就不再重复了,有兴趣的读者可以翻开之前的文章。 不过我利用这些新数据确实看到了一些有趣的变化。这篇文章将会零碎的分享这些新发现。 #### 天河一骑绝尘 从图像可以看出, 阅读全文
posted @ 2023-06-28 17:02 yukiwu 阅读(281) 评论(0) 推荐(3) 编辑
摘要: 还记得在2019年的夏天曾经用 R 爬过一份广州在 lianjia.com 放盘数据 ([博客1](https://www.cnblogs.com/yukiwu/p/10975337.html),[博客2](https://www.cnblogs.com/yukiwu/p/11271515.html 阅读全文
posted @ 2023-06-07 16:34 yukiwu 阅读(165) 评论(0) 推荐(1) 编辑
摘要: Exploratory data analysis (EDA) 是一种分析数据的方法。通常用于建模之前,以便总结数据的主要特征,从而更好的了解数据集,提取各变量之间的关系。 以下将总结几种常用的方法。 Descriptive Statistics 通常在开始分析数据时,我们会粗略的浏览一下数据,而 阅读全文
posted @ 2022-02-16 14:05 yukiwu 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 数据清洗是数据分析非常关键的一个步骤,也是一个必须的步骤。 这里记录了主要是记录如果利用 Python 来理解原始数据以及清洗数据。比如说如何处理缺失值,如何处理字段乱码,如何统一日期格式等等。 Handling Missing Value 对于某个字段内的缺失值,我们首先要分析一下为什么会出现缺失 阅读全文
posted @ 2022-02-09 17:54 yukiwu 阅读(57) 评论(0) 推荐(0) 编辑
摘要: 这里主要是整理 SQL 一些进阶的语法,方便自己不记得的时候可以快速查找。 Nested SELECT /* general syntax */ SELECT column1, column2 FROM table1 WHERE column1 OPERATOR (SELECT column1 FR 阅读全文
posted @ 2021-12-09 16:43 yukiwu 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 这里主要是整理 SQL 一些进阶的语法,方便自己不记得的时候可以快速查找。 String Patterns /* LIKE */ SELECT column1, column2, ... FROM table1 WHERE column1 LIKE '%pattern%'; /* BETWEEN . 阅读全文
posted @ 2021-12-08 18:49 yukiwu 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 这里主要是整理 SQL 一些基础的“增删查改”的语法,方便自己不记得的时候可以快速查找。 SELECT Statement /* general syntax */ SELECT column1, column2, ... FROM table1; /* retrieve all columns * 阅读全文
posted @ 2021-12-07 18:59 yukiwu 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 北上资金一直被誉为“聪明钱”,擅长左侧交易。现在很多机构和大户都会盯着北上资金调整自己的交易。这似乎已经是公开的秘密了。香港证券交易所每天收盘都会公布当天北上资金的持股量,所以我们也可以爬取这份数据抄一抄北上资金的作业。 爬取数据将会用到 《Python 学习笔记:获取网络数据》里提及的 urlli 阅读全文
posted @ 2021-07-23 16:41 yukiwu 阅读(963) 评论(0) 推荐(0) 编辑
摘要: 带下拉选项的输入框 (Textbox with Dropdown) 是既允许用户从下拉列表中选择输入又允许用户自由键入输入值。这算是比较常见的一种 UI 元素,可以为用户提供候选项节省操作时间,也可以给可能存在的少数情况提供适配的可能。 本来想着这个组件比较常见应该已经有比较多现成的例子可以直接应用 阅读全文
posted @ 2021-04-14 15:03 yukiwu 阅读(3659) 评论(0) 推荐(3) 编辑
摘要: Retrieving Data over HTTP Python 内置了 sockets 可以实现与网络连接并通过 Python 提取数据的功能。 socket 是可以提供双向连接的,我们可以对同一个 socket 进行读写操作。比方说,A 对 socket 写入信息,并且将其发送给 socket 阅读全文
posted @ 2021-04-07 15:28 yukiwu 阅读(717) 评论(0) 推荐(0) 编辑
摘要: Regular Expression (正则表达式) 是一种功能十分强大,但是又十分难以解读的古老的编程语言。通常的编程语言是以行作为最基础的解释单位,而 regular expression 则是以字符为基础解释单位。 Regular Expression Module 正则表达式在文本处理和文本 阅读全文
posted @ 2021-03-16 10:11 yukiwu 阅读(410) 评论(0) 推荐(0) 编辑
摘要: dictionaries 与 list 一样,也是 collections 的一种,但同时也是最为强大的一种。 list 是一种线性集合,集合内各种元素按顺序排列。而 dictionaries 则像一个袋子里装有各种元素,每个元素之间有各自的标签,但是各个元素之间并非按照固定的顺序排列的。 Dict 阅读全文
posted @ 2021-03-14 20:15 yukiwu 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 可排序表格 (Sortable & Searchable Tables) 在网页和表单设计中非常常用。用户可以通过点击表头对将表格以该列做顺序或降序排列,也可以利用 Search Box 对表格内容进行筛选。这个组件曾被运用于 X-Ray Diffraction Analysis App 和 Ext 阅读全文
posted @ 2021-03-03 16:20 yukiwu 阅读(2605) 评论(0) 推荐(0) 编辑
摘要: 搬运公众号早前文章 多选列表 (Multi-Select) 是一种将所有选项列出,并允许用户利用 Ctrl/Shift 键进行多选的 UI 元素。这是一种常见的设计元素。有时候为了节省空间,我们会将选项折叠于 Combo Box 中。为了方便用户操作,这个组件还将添加 Select All 和 Cl 阅读全文
posted @ 2021-03-02 14:57 yukiwu 阅读(3110) 评论(1) 推荐(1) 编辑
摘要: 纯粹是将之前公众号发过的实例搬运到这里。 第一弹是可拖放文本框。 可拖放文本框允许用户通过拖动备选项至文本框来确定输入,其实也可以说是 combobox 的一种变形。 与 combobox 相比,这种组件能让用户更加直观的看到所有备选项,并且可以是多个输入共用一组备选项。 类似的组件也曾用在 3D 阅读全文
posted @ 2021-03-01 10:37 yukiwu 阅读(1183) 评论(0) 推荐(0) 编辑