GB2312编码(为什么要加2020H、8080H,外码→内码→交换码→字形码)
摘要:为什么要加上2020H和8080H? 区位码、内码、国标码怎么转换非常简单,但是令人迷惑的是为什么要那么转换?这种转换不可能平白无故地那样转换! 我搜索很多资料,找到最好的解释,总结如下: 首先,注意到一点,GB2312虽说是对中文编码,但是里面有对26个英文字母和一些特殊符号的编码,按理说这和AS
阅读全文
posted @
2017-08-21 08:30
csguo
阅读(6167)
推荐(0) 编辑
Unicode和UTF-8的关系
摘要:Unicode和UTF-8的关系 今天下午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。 结果,这个问题比我想象的复杂,从午饭后一直看到晚上8:30点,才算初步搞清楚。 下面就是我的笔记,主要用来整理自己的思路。但是,我尽量试图写得通俗易懂,希望能对其他朋友有用。毕竟
阅读全文
posted @
2017-08-20 23:55
csguo
阅读(765)
推荐(1) 编辑
UTF-8编码
摘要:UTF-8是UNICODE的一种变长度的编码表达方式《一般UNICODE为双字节(指UCS2)》,它由Ken Thompson于1992年创建,现在已经标准化为RFC 3629。UTF-8就是以8位为单元对UCS进行编码,而UTF-8不使用大尾序和小尾序的形式,每个使用UTF-8存储的字符,除了第一
阅读全文
posted @
2017-08-20 23:42
csguo
阅读(1090)
推荐(0) 编辑
码表的理解(ASCII,GBK,Unicode,UTF-8等)。
摘要:以下任何言论都完全是个人的理解,如有雷同纯属巧合,如有错误,希望大家多多指出,共同学习!谢谢! 笔者是一个理解能力偏慢、稍钻牛角尖的程序员,什么东西都要从最基础理解起,一步一步向上理解,因此讲述时也是这样,讲述的也比较通俗,都是按照个人的理解来讲述的,也请大家少安毋躁。 在计算机中无论任何数据的传输
阅读全文
posted @
2017-08-20 23:24
csguo
阅读(5928)
推荐(3) 编辑
UniCode编码表
摘要:Unicode编码则是采用双字节16位来进行编号,可编65536字符,基本上包含了世界上所有的语言字符,它也就成为了全世界一种通用的编码,而且用十六进制4位表示一个编码,非常简结直观,为大多数开发者所接受,特别是十六进制编码后,可以解决汉字在js再编码过程中出现乱码问题,提高解释速度,我们建议在js
阅读全文
posted @
2017-08-20 22:47
csguo
阅读(209292)
推荐(10) 编辑
ASCII码对照表
摘要:ASCII(American Standard Code for Information Interchange,美国信息互换标准代码,ASCⅡ)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。 ASCI
阅读全文
posted @
2017-08-20 22:28
csguo
阅读(6774)
推荐(2) 编辑
GBK 编码
摘要:GBK编码范围:8140-FEFE,汉字编码范围见第二节:码位分配及顺序。 GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。GBK编码依然采用双字节编码方案,其编码范围:8140-FEFE,剔除xx7F码位,共23940个码位。共收录汉字和图形符号21886个,其中汉字(
阅读全文
posted @
2017-08-20 16:05
csguo
阅读(26589)
推荐(2) 编辑
计算机编码
摘要:编码是信息从一种形式或格式转换为另一种形式的过程也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码,是编码的逆过程。 ASC
阅读全文
posted @
2017-08-18 18:12
csguo
阅读(931)
推荐(1) 编辑
【扫盲】】32位和64位Windows的区别
摘要:用户购买windows安装盘或者重新安装操作系统的时候,通常会遇到这个问题,就是不知道该如何选择使用32位操作系统和64位操作系统,有人说64位系统速度快,其实理论上确实是这样,不过具体还要根据你的个人电脑实际的硬件情况来进行选择。 扫盲必看 32位和64位Windows的区别 32位和64位Win
阅读全文
posted @
2017-08-18 17:16
csguo
阅读(797)
推荐(0) 编辑
【基础】计算机的存储单元--01与字的转化
摘要:什么是位(bit)、字节(Byte)、字、KB、MB 位(bit):"位"是电子计算机中最小的数据单位,类似于(两,公斤,克)的概念。每一位的状态只能是0或1,比如:11010100是一个8位二进制数。一个二进制位只可以表示0和1两种状态(2^1);两个二进制位可以表示00、01、10、11四种(2
阅读全文
posted @
2017-08-18 17:14
csguo
阅读(1264)
推荐(0) 编辑
Hadoop深入浅出实战经典视频教程(共22讲)
摘要:该视频教程共22讲,由王家林老师主讲。 第01讲:为什么会有第一代大数据技术Hadoop和第二代大数据技术Spark? 第02讲:10分钟从技术角度理解Hadoop 第03讲:Hadoop集群安装解析 第04讲:Hadoop集群构建硬件选择、集群规模、网络拓扑、机架感知等 第05讲:Hadoop集群
阅读全文
posted @
2017-08-14 08:27
csguo
阅读(20084)
推荐(1) 编辑
Linux文件夹打包发送到本地
摘要:tar -cvf script.tar scriptsz script.tar 具体: sz/rz命令: 一般来说,linux服务器大多是通过ssh来进行远程的登陆和管理的,如何在命令方式下上传和下载文件到服务器和本地呢?与ssh有关的两个命令可以提供很方便的操作: sz:将选定的文件发送(send
阅读全文
posted @
2017-08-09 11:17
csguo
阅读(1089)
推荐(0) 编辑
hadoop HDFS常用文件操作命令
摘要:hadoop HDFS常用文件操作命令 shell hdfs MrZONT 2015年04月14日发布 | 1 收藏 | 33 51.2k 次浏览 hadoop HDFS常用文件操作命令 shell hdfs MrZONT 2015年04月14日发布 | 1 收藏 | 33 51.2k 次浏览 ha
阅读全文
posted @
2017-08-08 17:52
csguo
阅读(1240)
推荐(0) 编辑
Hadoop Shell命令
摘要:FS Shell cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test
阅读全文
posted @
2017-08-08 17:35
csguo
阅读(212)
推荐(0) 编辑
linux 下vim的使用(必看)
摘要:vi与vimvi编辑器是所有Unix及Linux系统下标准的编辑器,他就相当于windows系统中的记事本一样,它的强大不逊色于任何最新的文本编辑器。他是我们使用Linux系统不能缺少的工具。由于对Unix及linux系统的任何版本,vi编辑器是完全相同的,学会它后,您将在Linux的世界里畅行无阻
阅读全文
posted @
2017-08-08 15:08
csguo
阅读(1155)
推荐(0) 编辑
Linux vi/vim编辑器常用命令与用法总结
摘要:(一)vi/vim是什么?Linux世界几乎所有的配置文件都是以纯文本形式存在的,而在所有的Linux发行版系统上都有vi编辑器,因此利用简单的文字编辑软件就能够轻松地修改系统的各种配置了,非常方便。vi就是一种功能强大的文本编辑器,而vim则是高级版的vi,不但可以用不同颜色显示文字内容,还能进行
阅读全文
posted @
2017-08-08 14:51
csguo
阅读(508)
推荐(0) 编辑
CentOS 7_64位系统下搭建Hadoop_2.8.0分布式环境
摘要:准备条件: CentOS 7 64位操作系统 | 选择minimal版本即可(不带可视化桌面环境),也可以选择带完整版Hadoop-2.8.0 | 本文采用的是Hadoop-2.8.0版本。JDK1.8 | 本文采用jdk-8u131-linux-x64.tar.gz版本。 - 解压并配置JDK并配
阅读全文
posted @
2017-08-07 23:57
csguo
阅读(318)
推荐(0) 编辑
R语言数据重塑cbind+rbind+merge+ melt+cast
摘要:R语言中的数据重塑是关于变化的数据分为行和列的方式。大多数R地数据处理的时候是通过将输入的数据作为一个数据帧进行。这是很容易提取一个数据帧的行和列数据,但在某些情况,当我们需要的数据帧的格式是不同的来自收到它的格式。 R有许多函数用来分割,合并,改变行列,反之亦然在一个数据帧。 接合列和行中的数据帧
阅读全文
posted @
2017-08-07 14:56
csguo
阅读(3116)
推荐(0) 编辑
Hadoop家族学习路线图
摘要:Hadoop家族学习路线图 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Ooz
阅读全文
posted @
2017-08-07 08:16
csguo
阅读(327)
推荐(0) 编辑
R语言中apply函数
摘要:前言 刚开始接触R语言时,会听到各种的R语言使用技巧,其中最重要的一条就是不要用循环,效率特别低,要用向量计算代替循环计算。 那么,这是为什么呢?原因在于R的循环操作for和while,都是基于R语言本身来实现的,而向量操作是基于底层的C语言函数实现的,从性能上来看,就会有比较明显的差距了。那么如何
阅读全文
posted @
2017-08-06 12:01
csguo
阅读(3949)
推荐(0) 编辑
R语言数组array函数
摘要:数组是一个可以在两个以上的维度存储数据的R数据对象。例如 - 如果创建尺寸(2,3,4)的数组,那么创建4个矩形矩阵每2行3列。数组只能存储数据类型。 使用 array()函数创建数组。它需要向量作为输入,并使用 dim 参数的值,以创建一个数组。 示例 例子下面将创建的每两个3×3矩阵的数组,具有
阅读全文
posted @
2017-08-06 11:53
csguo
阅读(32788)
推荐(1) 编辑
R语言列表list函数
摘要:列表是R语言中的对象,它包含不同类型的元素,比如 - 数字,字符串,向量和另一个列表等。一个列表还可以包含一个矩阵或一个函数作为它的元素。使用list()函数创建列表。 创建一个列表 下面是一个例子来创建一个包含字符串,数字,向量和逻辑值的列表 当我们上面的代码执行时,它产生以下结果: 命名列表元素
阅读全文
posted @
2017-08-06 11:15
csguo
阅读(73852)
推荐(1) 编辑
R语言多元素向量
摘要:使用冒号运算带有数值数据(数值的增加为1) 当我们上面的代码执行时,它产生以下结果: 使用序列 (Seq.) 运算符 当我们上面的代码执行时,它产生以下结果: charToRaw:把字符串转化为数字数组进行输出。 使用 c() 函数 非字符值强制转换为字符类型,如果该元素之一是字符。 当我们上面的代
阅读全文
posted @
2017-08-06 11:07
csguo
阅读(1220)
推荐(0) 编辑
R语言提取字符串的一部分substring函数
摘要:这个函数提取字符串的一部分。 语法 substring()函数的基本语法是: 以下是所使用的参数的说明: x - 是字符向量输入。 first - 是第一个字符要被提取的位置。 last - 是最后一个字符要被提取的位置。 示例 当我们上面的代码执行时,它产生以下结果:
阅读全文
posted @
2017-08-06 10:43
csguo
阅读(58725)
推荐(1) 编辑
R语言改变大小写 toupper()和 tolower()函数
摘要:这些函数改变字符串的字符的大小写。 语法 toupper()和 tolower()函数的基本语法为: 以下是所使用的参数的说明: x - 向量输入。 示例 当我们上面的代码执行时,它产生以下结果:
阅读全文
posted @
2017-08-06 10:42
csguo
阅读(8568)
推荐(1) 编辑
R语言统计字符串的字符数ncahr函数
摘要:函数计算字符数量,包括在一个字符串的空格的个数。 语法 nchar()函数的基本语法是: 以下是所使用的参数的说明: x - 向量输入。 示例 当我们上面的代码执行时,它产生以下结果:
阅读全文
posted @
2017-08-06 10:41
csguo
阅读(9153)
推荐(0) 编辑
R语言格式化数字和字符串format函数
摘要:数字和字符串可以使用 format()函数的格式化为特定样式。 语法 format()函数的基本语法是: 以下是所使用的参数的说明: x - 为向量输入 digits - 是显示总位数 nsmall - 是最小位数的小数点右边 scientific - 设置为TRUE,则显示科学记数法 width
阅读全文
posted @
2017-08-06 10:40
csguo
阅读(22477)
推荐(0) 编辑
R语言paste函数
摘要:中许多字符串使用 paste() 函数来组合。它可以将任意数量的参数组合在一起。 语法 粘贴(paste)函数的基本语法是: 以下是所使用的参数的说明: ... - 表示要组合的任何数量的参数。 sep - 表示参数之间的分隔符。它是任选的。 collapse - 用于消除两个字符串之间的空间。但不
阅读全文
posted @
2017-08-06 10:33
csguo
阅读(53970)
推荐(1) 编辑
R语言函数
摘要:函数是一个组织在一起的一组以执行特定任务的语句。R语言有大量的内置函数,用户也可以创建自己的函数。 在R语言中的函数是一个对象,所以R语言解释器为能够通过控制到该函数,带有参数可能是函数必要完成的操作。 反过来函数执行其任务,并将控制返回到其可以被存储在其它的目的解释器以及任何结果。 函数定义 R函
阅读全文
posted @
2017-08-06 10:28
csguo
阅读(3311)
推荐(0) 编辑
R语言运算符
摘要:运算符是一个符号,告诉编译器执行特定的数学或逻辑操作。R语言有丰富的内置运算符,并提供以下类型的运算符。 运算符类型 算术运算符 关系运算符 逻辑运算符 赋值运算符 其他运算符 算术运算符 下表列出了用R语言支持的算术运算符。运算符作用向量中的每个元素。 关系运算符 下表列出了R语言中支持的关系运算
阅读全文
posted @
2017-08-06 09:59
csguo
阅读(13934)
推荐(0) 编辑
R语言 删除变量rm函数
摘要:变量可以通过使用 rm()函数来删除。下面我们删除变量var.3。然后再打印变量时出现异常错误。 当上面的代码执行时,它产生以下结果: 所有的变量可以通过使用rm()和 ls()函数来一起删除。 当上面的代码执行时,它产生以下结果:
阅读全文
posted @
2017-08-06 09:40
csguo
阅读(21963)
推荐(0) 编辑
R语言查找变量ls函数
摘要:要知道目前在工作区中的可用变量,可以使用 ls()函数列出所有变量。 另外,ls() 函数可以使用模式来匹配变量名称。 当上面的代码执行时,它产生以下结果: 注: 示例输出是根据变量在环境声明来输出显示的。 在 ls() 函数可以使用模式匹配变量名。 当上面的代码执行时,它产生以下结果: 以点(.)
阅读全文
posted @
2017-08-06 09:37
csguo
阅读(8985)
推荐(0) 编辑
R语言变量赋值
摘要:变量可以使用向左,向右且等于操作符来分配值。可以使用 print() 或 cat() 函数打印变量的值。cat() 函数将多个项目并成连续并打印输出。 当我们上面的代码执行时,它产生以下结果: 注: 矢量c(TRUE,1)有逻辑和数值类的混合。因此,逻辑类强迫转换到数字类,如TRUE为1。 变量的数
阅读全文
posted @
2017-08-06 09:34
csguo
阅读(6958)
推荐(0) 编辑
R语言矩阵matrix函数
摘要:矩阵是元素布置成二维矩形布局的R对象。 它们包含相同原子类型的元素。尽管我们可以创建只包含字符或只逻辑值的矩阵,但是它们没有多大用处。我们使用的是在数学计算中含有数字元素矩阵。 使用 matrix()函数创建一个矩阵。 语法 R语言中创建矩阵的基本语法是: 以下是所使用的参数的说明: data -
阅读全文
posted @
2017-08-05 19:59
csguo
阅读(60096)
推荐(0) 编辑
R语言常用命令集合
摘要:help.start()//打开帮助文档 q()//推出函数 ls()//返回处于现在名空间的对象名称 rm()//清楚对象;rm(list=ls())清除所有内存数据 gc()//垃圾回收数据 sqrt(x)//标准差 rnorm()函数 rnorm()函数 rnorm(n, mean = 0,
阅读全文
posted @
2017-08-05 19:17
csguo
阅读(2456)
推荐(0) 编辑
R语言数据类型
摘要:当编写任何编程语言程序,需要使用不同的变量来存储各种信息。变量不过是用于保留存储器位置的存储值。这意味着,当创建一个变量,它会保留在内存中的一些空间。 你可能喜欢存储诸如字符以外的数据类型,如:宽字符,整型,浮点型,双浮点型,布尔等信息。基于变量的数据类型,操作系统分配内存,并决定什么可以存储在存储
阅读全文
posted @
2017-08-04 15:34
csguo
阅读(3757)
推荐(0) 编辑