摘要: 首先,我们要明白一个道理,什么是架构? 王概凯的架构漫谈中说道,根据要解决的问题,对目标系统的边界进行界定。并对目标系统按某个原则的进行切分。切分的原则,要便于不同的角色,对切分出来的部分,并行或串行开展工作,一般并行才能减少时间。并对这些切分出来的部分,设立沟通机制。使得这些部分之间能够进行有机的 阅读全文
posted @ 2024-02-29 09:01 YE- 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 要实现大数据的热词爬取,你可以按照以下步骤使用 Python 来完成: 选择合适的网站进行爬取:选择包含大量文本数据的网站,比如新闻网站、社交媒体、论坛等。常见的选择包括新浪新闻、Twitter、Reddit 等。 使用爬虫库进行网页内容的爬取:使用 Python 中的爬虫库(如 Beautiful 阅读全文
posted @ 2024-01-26 16:46 YE- 阅读(52) 评论(0) 推荐(0) 编辑
摘要: Scala 和 Python 都是通用编程语言,但它们有一些区别,涉及到语法、执行速度、类型系统等方面。下面是 Scala 和 Python 的一些对比: 类型系统: Scala: 是一种静态类型语言,编译时会检查类型。Scala 的类型系统相对较强,允许程序员定义和使用复杂的类型结构。 Pytho 阅读全文
posted @ 2024-01-25 16:11 YE- 阅读(13) 评论(0) 推荐(0) 编辑
摘要: Python 在深度学习领域拥有广泛的应用,主要得益于其丰富的库和框架以及易用性。以下是 Python 编程语言在深度学习方向上的一些重要方面: 深度学习框架:Python 有许多流行的深度学习框架,如 TensorFlow、PyTorch、Keras、MXNet 等。这些框架提供了丰富的工具和AP 阅读全文
posted @ 2024-01-24 09:06 YE- 阅读(14) 评论(0) 推荐(0) 编辑
摘要: Spark Streaming 是 Apache Spark 提供的用于实时流数据处理的组件。它能够以高吞吐量、容错性强、可扩展性好的方式处理实时数据流。Spark Streaming 可以与 Spark 的核心 API(如RDD、DataFrame、Dataset)无缝集成,这使得用户可以在同一个 阅读全文
posted @ 2024-01-23 22:42 YE- 阅读(16) 评论(0) 推荐(0) 编辑
摘要: Spark 是一个用于大数据处理的快速、通用、可扩展的分布式计算引擎。它提供了高效的数据处理能力,支持在大规模数据集上进行复杂的数据分析和处理任务。Spark 的核心特点包括: 速度:Spark 使用内存计算(In-Memory Computing)技术,将数据存储在内存中进行处理,因此比传统的基于 阅读全文
posted @ 2024-01-22 08:08 YE- 阅读(8) 评论(0) 推荐(0) 编辑
摘要: Spark MLlib 是 Apache Spark 生态系统中的一个机器学习库,它提供了丰富的工具和算法,用于在大规模数据集上进行机器学习任务的开发和执行。MLlib 提供了分布式的机器学习算法,能够有效地处理大规模数据,并且可以在 Spark 的集群上并行运行。以下是 Spark MLlib 的 阅读全文
posted @ 2024-01-21 22:44 YE- 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 使用 Spark 机器学习库(MLlib)进行编程实践通常涉及以下步骤: 导入必要的库: 在开始之前,需要导入 Spark 相关的库以及 MLlib 中的机器学习算法所需的类。 import org.apache.spark.ml._ import org.apache.spark.ml.featu 阅读全文
posted @ 2024-01-20 17:51 YE- 阅读(75) 评论(0) 推荐(0) 编辑
摘要: Spark Streaming 是 Apache Spark 生态系统中用于实时数据处理的组件,它允许在流数据上执行复杂的批处理操作。下面是 Spark Streaming 初级实践的一般步骤: 导入必要的库和创建 StreamingContext: 使用 Scala、Python 或 Java 编 阅读全文
posted @ 2024-01-19 17:52 YE- 阅读(120) 评论(0) 推荐(0) 编辑
摘要: Spark SQL 提供了一种基于结构化数据处理的高级 API,它允许使用 SQL 或 DataFrame API 进行数据查询和分析。以下是 Spark SQL 中常用的语句: 创建表格: 使用 CREATE TABLE 语句创建表格,可以基于现有数据源或手动定义模式。 示例:CREATE TAB 阅读全文
posted @ 2024-01-18 16:11 YE- 阅读(24) 评论(0) 推荐(0) 编辑