暑假第二周总结

本周主要学习了如何配置hadoop，真的是超级麻烦。本周完成了对Linux系统的学习，安装了vm虚拟机，配置了3个centos虚拟机，完成了虚拟机之间的免密登录等一系列的操作，虚拟机配置了java环境，hadoop环境，部署了HDFS集群。了解了大数据的软件生态、Hadoop是什么以及为什么需要分布式存储。

　　本周的学习和实践经历让我深刻体会到了配置Hadoop的复杂性。尽管过程繁琐，但通过不懈的努力，我成功地在Linux系统上安装并配置了VMware虚拟机，创建了3个CentOS虚拟机。这些虚拟机不仅实现了免密登录，还配置了Java环境和Hadoop环境，为HDFS集群的部署奠定了基础。这一过程让我对大数据软件生态有了更深入的了解，也认识到了分布式存储在处理大规模数据时的重要性。

在配置过程中，我遇到了不少挑战。例如，虚拟机之间的网络配置、Hadoop环境变量的设置等，都曾让我头疼不已。但通过查阅资料、反复试验，我逐步解决了这些问题。这些经历教会了我，学习新技术时，环境配置是至关重要的第一步。如果环境配置不当，后续的学习将难以为继。

此外，我还学习了Hadoop的基本原理和架构。Hadoop是一个开源的分布式存储和计算框架，它能够处理大量数据，并且具有高可靠性和可扩展性。通过HDFS，Hadoop提供了一个分布式文件系统，允许数据在多个节点上存储和访问，从而提高了数据的可用性和容错性。

在接下来的学习中，我计划深入了解Hadoop的MapReduce编程模型。MapReduce是Hadoop的核心计算框架，它通过简单的接口，允许用户编写并行处理大量数据的程序。我希望通过实践MapReduce，进一步提高我的数据处理能力。

同时，我也意识到了学习大数据技术不仅仅是掌握工具的使用，更重要的是理解其背后的原理和思想。因此，我将花更多时间研究Hadoop的内部机制，包括它的调度算法、数据本地性原则等，以便更好地利用这一强大的工具。

配置的过程很麻烦，在配置的时候遇到了一些小问题，但都得以解决。学习新技术的时候，配置环境是最重要的，环境若配置不对，后面的学习将无法进行

posted @ 2024-07-13 20:38 笠大阅读(32) 评论(0) 收藏举报

刷新页面返回顶部

Drip

铁大软工人

暑假第二周总结

公告