摘要:
学习时间 代码量 博客量 学习的知识点 下周的任务 20个小时左右 200行左右 1 根据网上的教程安装hadoop集群,并配置文件。 调试运行hadoop 阅读全文
摘要:
学习时间 代码量 博客量 学习的知识点 下周的任务 10个小时 100行左右 2 了解hadoop的相关知识 下载Hadoop相关资料并配置安装 阅读全文
摘要:
今天上午老师进行了开学以来的第一次课堂测试,我们经过了三个多小时的艰苦奋斗,我还是没有达到老师的及格标准。 开学第一次考试,看到题的时候有点懵,感觉这题好难,一下就乱了。可能是太久没用的缘故,花了好半天才回忆起来怎么写。于是便开始操作了。 但是在之后又出现了问题,刚开始的设计界面还好,但是后面就乱了 阅读全文
摘要:
初步了解大数据 “大数据”是一个体量特别大,数据类型特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 大数据分析 1. 可视化分析 大数据分析的使用者有大数据分析专家,同时还有普通用户,但是二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大 阅读全文
摘要:
正则表达式 match方法从字符串的起始位置匹配一个模式,如果没有匹配成功match就返回None。 pattern:正则表达式。string:待匹配的字符串。flags:匹配模式(是否区分大小写、单行匹配还是多行匹配)。match返回的是一个re.Match对象,后面会详细介绍Match中的方法。 阅读全文
摘要:
利用python爬取网页图片 代码中所用的正则表达式需要导入的模块就是re,这是一个Python处理文本的标准库。 因为re是内置模块,所以不需要再下载,使用时直接引入即可: 阅读全文
摘要:
python学习笔记 对象的删除 del命令可以显示删除并解除值之间的指向关系,如果变量指向的值还有别的变量指向,则不删除该值。 del可以删除列表中指定元素,也可以删除整个列表 del无法删除元组或字符串中的指定元素,只能删除整个字符串(两者属于不可变序列) 基本的输入输出 在python中,使用 阅读全文
摘要:
本周开始着手准备了中国软件杯比赛的作品,所以本周学习了使用python和tesseract-ocr来实现对一种图片里面文字的识别。 首先是要安装tesseract-ocr软件,这要到GitHub上去寻找安装包,下载好了之后开始安装: 然后点击next 继续点击next,展开最后一项选择语言chi_s 阅读全文
摘要:
本周最新学习了如何使用Javaweb加servlet来连接和操作大型数据库oracle,我使用的编程软件是idea,对于自己不知道的只是我已经习惯了去问度娘了。网上有好多关于使用idea连接和配置oracle的详细教程,然后通过自己之前使用idea连接操作MySQL的经验,成功的摸索出了idea连接 阅读全文
摘要:
本周学习了如何使用python语言来连接大型数据库oracle,这也是一个艰难而又复杂的过程啊。由于我是第一次使用oracle数据库,所以连怎样新建一个数据库都不会。在网上搜寻并借鉴了很多别人的经验,终于完成了数据库的建立。 先是需要新建一个表空间: 然后点击新建表空间 输入各项数据和参数 建立之后 阅读全文