2016年5月10日

摘要: Hadoop组成 包括两个核心组成:HDFS:分布式文件系统,存储海量的数据MapReduce:并行处理框架,实现任务分解和调度 搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务(搜索引擎、日志分析、商业智能、数据挖掘) 安装Java JDK 1,进入Sshell,检测是否安装java2, 阅读全文

posted @ 2016-05-10 23:27 博雅塔之子 阅读(178) 评论(0) 推荐(0) 编辑

摘要: 文本挖掘介绍 文本挖掘:“自动化或半自动化处理文本的过程”,包含了文档聚类、文档分类、自然语言处理、文本变化分析及网络挖掘等领域内容。对于文本处理过程首先需要有分析的语料(text corpus),然后根据这些语料建立半结构化的文本库(text database)。最后生成包含语频的结构化的词条—— 阅读全文

posted @ 2016-05-10 23:23 博雅塔之子 阅读(2495) 评论(0) 推荐(0) 编辑

摘要: 学习目标 部署数据库服务 1,搭建简单的单机服务2,搭建具有冗余容错功能的复制集3,搭建大规模数据集群4,完成集群的自动部署 MongoDB使用 1,文档的读写更新删除2,各种不同类型的索引的创建与使用3,复杂的聚合查询4,对数据集合进行分片,在不同分片间维持数据均衡5,数据备份与恢复6,数据迁移 阅读全文

posted @ 2016-05-10 23:14 博雅塔之子 阅读(296) 评论(0) 推荐(0) 编辑

摘要: R的对象类型包括数值型(numeric),复数型(complex),逻辑型(logical),字符型(character)和原味型(raw),列表(list)递归结构:函数(function)和表达式(expression),内在属性:函数mode和length 允许R把z当作一个10*10的矩阵。 阅读全文

posted @ 2016-05-10 23:08 博雅塔之子 阅读(296) 评论(0) 推荐(0) 编辑

摘要: 颜色、图例和线 在散点图中添加信息、图例以及回归线。 模拟数据 #模拟数据 dat <- data.frame(X = runif(100,-2,2),T1 = gl(n=4,k=25,labels = c("Small","Medium","Large","Big")),Site = rep(c( 阅读全文

posted @ 2016-05-10 23:03 博雅塔之子 阅读(821) 评论(0) 推荐(0) 编辑

摘要: rlist扩展包 设计目标:更方便地在R中操作list对象 特性: 提供一系列高阶函数,可以方便地对list对象中的元素进行映射(mapping)、筛选(filtering)、分组(grouping)、排序(sorting)、合并(joining)、更新(updating)、搜索(searching 阅读全文

posted @ 2016-05-10 22:57 博雅塔之子 阅读(926) 评论(0) 推荐(0) 编辑

摘要: 数据结构 创建向量和矩阵 函数c(), length(), mode(), rbind(), cbind() 求平均值,和,连乘,最值,方差,标准差 函数mean(), sum(), min(), max(), var(), sd(), prod() 帮助文档 函数help() 生成向量 seq() 阅读全文

posted @ 2016-05-10 22:37 博雅塔之子 阅读(4961) 评论(0) 推荐(1) 编辑

摘要: 变量和数据类型 一、整数十六进制用0x前缀和0-9,a-f表示,例如:0xff00,0xa5b4c3d2 整数和浮点数混合运算的结果变成浮点数。整数除法,除不尽时,结果仍是整数,余数直接被扔掉。同时,Python提供了一个求余的运算%可以计算余数11%4 如果要计算11/4的精确结果,按照“整数和浮 阅读全文

posted @ 2016-05-10 22:04 博雅塔之子 阅读(369) 评论(0) 推荐(0) 编辑

摘要: scrapy安装 1,安装pywin32,选择对应的版本 2,安装twisted,选择对应版本 3,安装zope.interface,测试安装是否成功import zope.interface 4,安装pyopenssl,验证安装情况import OpenSSL 5,安装lxml 6,安装easyt 阅读全文

posted @ 2016-05-10 21:55 博雅塔之子 阅读(448) 评论(0) 推荐(0) 编辑

摘要: PHP基础 PHP,运行在Web服务器端的编程语言。 PHP特点与功能1、运行在服务器端:PHP用于处理存储在服务器的数据。2、跨平台:3、脚本语言:4、免费 代码标识 Echo语句echo是PHP中的输出语句,可以把字符串输出(字符串用双引号括起) 字符串使用连接符把两个字符连接起来 注意:在PH 阅读全文

posted @ 2016-05-10 21:47 博雅塔之子 阅读(146) 评论(0) 推荐(0) 编辑

摘要: 开源软件 设置英文环境方法一:1,修改Ubuntu的配置文件sudo vim /etc/default/locale 2,将配置内容修改为 保存后在终端运行命令locale-gen -en_US:en 然后注销重启即可 方法二:1,打开配置文件vim /etc/environment 2,添加配置内 阅读全文

posted @ 2016-05-10 21:45 博雅塔之子 阅读(206) 评论(0) 推荐(0) 编辑

摘要: !以下均在VMware下安装Linux server配置桥接网络,root用户 Ubuntu server 安装openssh 1,进入root,apt-get update 2,安装ssh,apt-get install openssh-server 3,查看ssh服务是否启动,ps -e |gr 阅读全文

posted @ 2016-05-10 21:39 博雅塔之子 阅读(4838) 评论(0) 推荐(0) 编辑

摘要: Android Activity TextView,Button 1、在fragment_main.xml文件中直接添加控件 2、在MainActivity.java文件中添加TextView控件 在此处添加代码运行出错,后来得知不可 在此处添加调用代码,运行成功 设置TextView文本顶行居中 阅读全文

posted @ 2016-05-10 21:37 博雅塔之子 阅读(298) 评论(0) 推荐(0) 编辑

摘要: 1、让TextView里的内容水平居中 2、让TextView控件在它的父布局里水平居中 3、文本布局示例 Copyright © 吴华锦雅致寓于高阁渔舟唱晚,古典悠然格调外发园林绿树萦绕,馥郁清香 阅读全文

posted @ 2016-05-10 21:36 博雅塔之子 阅读(3044) 评论(0) 推荐(0) 编辑

摘要: 使用Eclipse创建Android项目,project多出appcompat_v7,此情况在ADT升级到22.6.x版本后出现,22.3.x前版本不存在。此项为了实现向下兼容sdk的功能。 点击项目右键,Properties->Android右下 创建Android项目,选择Android版本号, 阅读全文

posted @ 2016-05-10 21:36 博雅塔之子 阅读(290) 评论(0) 推荐(0) 编辑

摘要: 多个Activity之间的调用 建立一个Activity 配置layout文件夹下fragment_main.xml文件 在layout下新建other.xml文件 xml文件创建的id需要编译才能生成 在同一工程src文件夹下新建class文件 查找id并作关联 加入监听器,调用另一个Activi 阅读全文

posted @ 2016-05-10 21:36 博雅塔之子 阅读(294) 评论(0) 推荐(0) 编辑

摘要: 工具准备: 下载ISO系统镜像,UltraISO,EasyBCD,分区助手,8G 优盘 U盘启动制作流程: 1,打开分区助手,从硬盘中分出空闲空间(60G)作为Ubuntu工作空间,文件系统设为Ext4; 2,打开UltraISO,点击“启动”—>“写入硬盘镜像”,设定驱动器为U盘,“镜像文件”为I 阅读全文

posted @ 2016-05-10 21:35 博雅塔之子 阅读(507) 评论(0) 推荐(0) 编辑

摘要: Android系统中所有activity采用activity堆栈的管理方式。 一个activity基本上处于四种状态之一 activity处于屏幕前台运行(activity位于堆栈顶部) activity已经失去焦点,但仍然可见,此时activity处于暂停状态 当一个Activity跳转到另一个A 阅读全文

posted @ 2016-05-10 21:35 博雅塔之子 阅读(337) 评论(0) 推荐(0) 编辑

摘要: 常用控件 EditView、TextView、Button 设置layout,在fragment_main.xml配置控件 配置可编辑文本控件factorOne、factorTwo,显示文本控件symbol,按钮控件calculate 在values下string.xml设置symbol、calcu 阅读全文

posted @ 2016-05-10 21:35 博雅塔之子 阅读(282) 评论(0) 推荐(0) 编辑

摘要: Universal Feed Parser Universal Feed Parser可以用于分析RSS和Atom的订阅源。利用该函数库从在线的新闻站点下载博客帖子和文章。项目地址 将下载的文件解压到一个空文件下,在所在文件夹feedparser打开命令行:python setup.py insta 阅读全文

posted @ 2016-05-10 21:34 博雅塔之子 阅读(569) 评论(0) 推荐(0) 编辑