摘要: 111 阅读全文
posted @ 2025-03-26 18:48 芊羽鱼 阅读(4) 评论(0) 推荐(0)
摘要: 使用贴现率8%和12%分别计算每个项目的净现值(NPV) JAVA实现 净现值求解 实现代码(JAVA): package com.zuoye.Three;import java.math.BigDecimal;public class TieXianLu { public static void 阅读全文
posted @ 2025-03-10 22:20 芊羽鱼 阅读(8) 评论(0) 推荐(0)
摘要: 在当今数字化时代,软件系统已成为推动社会进步的重要力量。而软件架构,作为软件系统的核心骨架,更是决定其成败的关键因素之一。初读王概凯老师的《架构漫谈》系列文章,仿佛在迷雾中窥见灯塔的光芒。当数字化浪潮裹挟着无数代码奔涌向前,软件架构师如同掌舵的智者,以理性的锋芒劈开混沌。前三篇的阅读之旅,不仅让我触 阅读全文
posted @ 2025-02-19 20:48 芊羽鱼 阅读(4) 评论(0) 推荐(0)
摘要: 首先我采用一个数据进行实验,过程也是从0开始包括对spark环境的配置以及sqoop的运用: 时效性分析(部门平均处理时长) sql 复制 CREATE TABLE analysis_duration AS SELECT org, AVG(duration_days) AS avg_days, PE 阅读全文
posted @ 2025-02-10 20:43 芊羽鱼 阅读(15) 评论(0) 推荐(0)
摘要: 今天主要完成: 1) 数据采集:要求从定期自动从网络中爬取信息领域的相关热词; 2) 数据清洗:对热词信息进行数据清洗,并采用自动分类技术生成信息领域热词目录,; 3) 热词解释:针对每个热词名词自动添加中文解释(参照百度百科或维基百科); import requestsimport reimpor 阅读全文
posted @ 2025-02-08 21:55 芊羽鱼 阅读(9) 评论(0) 推荐(0)
摘要: #!/usr/bin/env python3import sysimport jsonimport refrom datetime import datetimefrom html import unescapedef clean_html(raw_html): """ 清洗HTML标签和特殊字符 阅读全文
posted @ 2025-02-07 23:38 芊羽鱼 阅读(5) 评论(0) 推荐(0)
摘要: 使用 Linux 系统的常用命令 启动 Linux 虚拟机,进入 Linux 系统,通过查阅相关 Linux 书籍和网络资料,或者参考 本教程官网的“实验指南”的“Linux 系统常用命令”,完成如下操作: (1) 切换到目录 /usr/bin; (2) 查看目录/usr/local 下所有的文件; 阅读全文
posted @ 2025-02-06 16:31 芊羽鱼 阅读(4) 评论(0) 推荐(0)
摘要: 今天开始简单了解了python爬虫,并安装了相关依赖 import requestsfrom bs4 import BeautifulSoupimport pandas as pd# 爬取一个页面的数据def scrape_page(url): headers = { "User-Agent": " 阅读全文
posted @ 2025-01-10 11:10 芊羽鱼 阅读(3) 评论(0) 推荐(0)
摘要: (一)编程实现文件合并和去重操作 对于两个输入文件,即文件A和文件B,请编写MapReduce程序,对两个文件进行合并,并剔除其中重复的内容,得到一个新的输出文件C。下面是输入文件和输出文件的一个样例供参考。 输入文件A的样例如下: 20170101 x 20170102 y 20170103 x 阅读全文
posted @ 2024-12-18 11:02 芊羽鱼 阅读(4) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2024-12-16 11:02 芊羽鱼 阅读(3) 评论(0) 推荐(0)