摘要:
一 Mac 1 文本编辑(emacs风格) 光标移动 Ctrl+A (Ahead 行首) Ctrl+E (End 行尾) Ctrl+P (Previous 上一行/命令行中上一个命令) Ctrl+N (Next 下一行/命令行中下一个命令) Ctrl+B (Backward 左移一个字符) Ctrl 阅读全文
摘要:
一 vi配置文件 ~/.vimrcor/etc/vimrc ps:如果使用的是idea中的vim插件,使用的配置文件为 ~/.ideavimrc~~~`s 配置文件中可以修改配色,可以修改键位绑定,可以修改配置,比如 inoremap <C-a> <Home> inoremap <C-e> <End 阅读全文
摘要:
1 磁盘、cpu、内存相关 查看全部设备信息 # lspci 查看整体磁盘空间占用情况 # df -h 查看磁盘分区及文件系统 # df -T 查看整体磁盘inode占用情况 # df -i 查看文件详细信息 # ls -l $path 查看文件inode信息 # ls -i $path# stat 阅读全文
摘要:
scala 官方地址 https://www.scala-lang.org/ 本文尽可能包含了一些主要的java和scala在编程实践时的显著差异,展现scala的代码的简洁优雅;scala通吃<面向对象编程Object Oriented Programming>和<函数式编程Functional 阅读全文
摘要:
对文件进行词频统计,是一个大数据领域的hello word级别的应用,来看下实现有多少种: 1 Linux单机处理 egrep -o "\b[[:alpha:]]+\b" test_word.log|sort|uniq -c|sort -rn|head -10 2 Scala单机处理(Array) 阅读全文
摘要:
hbase有一个region一直处于rit状态,对该region进行move/assign/unassign都没有反应,使用hbck2进行assigns/unassigns也没有反应 查改hbase当前的lock状态发现 hbase(main):003:0> list_locks NAMESPACE 阅读全文
摘要:
HMaster页面上Regions In Transition部分有一个region一直处于transition状态,但是没有超时,而是不断重试,1s会重试4-5次,region信息 NS1:TB1,4120J5402AAD3N76TRTffUlocation1618464157000,163790 阅读全文
摘要:
hbase集群重启后异常,发现是master初始化失败导致的,在master启动日志中发现问题原因为 2022-05-26 14:06:15,645 WARN org.apache.hadoop.hbase.master.HMaster: hbase:namespace,,1607716627354 阅读全文
摘要:
Write-Ahead Log Provide durability guarantee without the storage data structures to be flushed to disk, by persisting every state change as a command 阅读全文
摘要:
http://hive.apache.org/ The Apache Hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed st 阅读全文
摘要:
SQL-Structured Query Language 语言简洁,易学易用 DDL:Create、Drop、Alter DML:ISUD(Insert、Select、Update、Delete) 权限 Grant、Revoke 场景 olap(Analysis) oltp(Transaction 阅读全文
摘要:
https://hadoop.apache.org A framework for job scheduling and cluster resource management. 一 部署 角色 ResourceManager、NodeManager 客户端 Job、AppMaster、Contai 阅读全文
摘要:
https://hadoop.apache.org A distributed file system that provides high-throughput access to application data. 特点: 大文件、一次写入多次读取,修改只支持Append 多副本 流式、非低延时 阅读全文
摘要:
机器学习算法 Classification 分类:性别分类、年龄分类 Clustering 聚类:常用地址聚类 Regression 回归:销量预测,续航里程预测 Collaborative Filtering 协同过滤(User-based, Item-based):个性化推荐 流程 pipeli 阅读全文
摘要:
一 50年科技发展史 方向 公司组织 年代 代表 大型机 IBM 70年代 System z、AIX 小型机 DEC、SUN 80年代 SPARC、Solaris 廉价PC+光纤 Google 90年代 Intel、Seagate 大数据 Google 2003-2004 GFS、MapReduce 阅读全文