上一页 1 2 3 4 5 6 7 8 9 ··· 15 下一页
摘要: 由于虚拟机运行比较卡顿,因此我觉定把其相关编程在主机的eclipse上运行,但在虚拟机上运行的好好程序到了本机上却不管用了,连接不到hbase,卡在一个地方不动 映射什么的都没问题但就是连接不上 看了https://www.cnblogs.com/huan-ch/p/11689016.html#47 阅读全文
posted @ 2020-10-18 22:06 溜了溜 阅读(420) 评论(0) 推荐(0) 编辑
摘要: 本周主要是对大数据进行了进一步学习,现在已经学会了基本的hdfs文件操作以及hbase的数据存取操作。软件需求分析方面对于之前的报表征集系统的需求变更进行了进一步的功能更改,对需求变更方面有了更深的理解。下一周继续学习大数据相关知识。 阅读全文
posted @ 2020-10-18 21:55 溜了溜 阅读(53) 评论(0) 推荐(0) 编辑
摘要: 本周主要是制作了河北重大技术需求分析的数据录入板块,通过这个主要是练习了前端的制作,例如通过js以及json数据进行多级联动,还有一些特殊条件的查询等等。另外就是软件需求的分析,对于客户提出的要求我们作为软件的设计者以现有技术为根基来进行设计,设计出尽可能合理的系统,并针对其中的诸多细节与客户进行交 阅读全文
posted @ 2020-10-10 21:32 溜了溜 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 本周的学习时间大概6小时左右,代码量500行左右,主要尝试对爬取的数据进行一定的处理并存入数据库。 阅读全文
posted @ 2020-08-31 22:52 溜了溜 阅读(79) 评论(0) 推荐(0) 编辑
摘要: 本周的学习时间大概6小时左右吧,由于要准备一系列的开学考试,敲代码的时间就缩水很多了。代码量600行左右,主要是webmagic的一些进阶使用和学习py的scrapy框架,下一步也是进一步学习scrapy还有mapreduce,争取早日能把mapreduce与爬虫结合使用。 阅读全文
posted @ 2020-08-25 17:19 溜了溜 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 对过去的一周进行一下总结,学习时间大概十小时左右,代码800行。主要对webmagic框架进行了学习,现在已经能够基础运用。 除此之外还对mapreduce进行了初步学习,并开始尝试运用。 阅读全文
posted @ 2020-08-18 17:22 溜了溜 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 通过这两天的学习,对WebMagic有了初步的掌握,这里分享的这个小项目是用于爬取我个人博客的所有标题,我尽量说的详细些,希望可以帮到和我一样的初学者。 思路: 首先确定爬取目标,那就是我的博客https://www.cnblogs.com/liuleliu/中所有的标题。 通过观察网页代码可发现, 阅读全文
posted @ 2020-08-15 20:49 溜了溜 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 经历多天的努力,hadoop的环境配置已经完成,编译器也能成功连接,下一步就是开始学习框架,第一个目标为WebMagic,这应该是比较简单好上手的java爬虫框架,先把这个搞懂,再以此为基础进行下一步。 今天对WebMagic进行了初步的概念上的认识,在此做个笔记。 WebMagic是一个简单灵活的 阅读全文
posted @ 2020-08-13 17:07 溜了溜 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 今天对这一周以来的学习做个总结吧,可以说是十分坎坷,打算学hadoop,但直到目前为止还没有进行webcount的相关代码实践,对其的掌握停留在一个逻辑概念认知。这一周主要就是忙活着配置环境,截至今天,虚拟机上的hadoop算是基本按装完毕,接下来我需要用编译器连接上hadoop,这样就能进行代码的 阅读全文
posted @ 2020-08-09 19:16 溜了溜 阅读(87) 评论(0) 推荐(0) 编辑
摘要: 我的情况是在把selinux改为'disabled'后系统便不能启动了 解决方法: 在进入linux启动界面的时候按下f2 进入此界面 按e进入,选择第二个,也是按e进入编辑 末尾添加 selinux=0 回车 这时候再按b,就可以正常启动了。 参照于这篇帖子:https://blog.csdn.n 阅读全文
posted @ 2020-08-06 11:46 溜了溜 阅读(1284) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 15 下一页