摘要:
地址:http://www.cnblogs.com/jarlean/archive/2013/04/12/3015911.htmlQ21. What is the characteristic of streaming API that makes it flexible run map reduce jobs in languages like perl, ruby, awk etc. (streaming的什么特性让他支持多语言的MR任务)Hadoop Streaming allows to use arbitrary programs for the Mapper and Reducer 阅读全文
摘要:
地址: http://www.cnblogs.com/jarlean/archive/2013/04/11/3013583.htmlQ16. Suppose Hadoop spawned 100 tasks for a job and one of the task failed. What willhadoop do ? It will restart the task again on some other task tracker and only if the task fails more than 4 (default setting and can be changed) tim 阅读全文
摘要:
地址: http://www.cnblogs.com/jarlean/archive/2013/04/10/3011667.htmlQ11. Give an example scenario where a cobiner can be used and where it cannot be used There can be several examples following are the most common ones - Scenario where you can use combiner Getting list of distinct words in a file (进行. 阅读全文
摘要:
地址:http://www.cnblogs.com/jarlean/archive/2013/04/09/3009855.htmlQ6. What is the purpose of RecordReader in Hadoop The InputSplithas defined a slice of work, but does not describe how to access it. The RecordReaderclass actually loads the data from its source and converts it into (key, value) pairs 阅读全文
摘要:
以下题目注释为自己添加,如果有不正确的,希望有大牛指正,谢谢地址:http://www.cnblogs.com/jarlean/archive/2013/04/08/3008308.htmlQ1. Name the most common InputFormats defined in Hadoop? Which one is default ?(Text是默认的格式) Following 2 are most common InputFormats defined in Hadoop - TextInputFormat - KeyValueInputFormat - SequenceFile 阅读全文
摘要:
1.Hadoop是什么?2.Hadoop的架构? 3.Hadoop的实现? 4.子项目及其作用? 5.冗余机制? 6.HA实现? 7.元数据的同步问题? 8.锁机制? 9.索引实现? 10.参数配置(这个肯定是重点中的重点)? 11.原理图? 12.相关指令? 13.产生背景? 14.监控? 15.负载均衡?16.如何优化? 阅读全文
摘要:
选定一个编辑的表,右键- >Properties- >Columns- >Customize Columns and Filter(或直接用快捷键Ctrl+U)- >Comment(前面打勾)。 阅读全文
摘要:
看到同事的存储存储过程使用 SP_EXECUTESQL 来执行字符串,感觉有点复杂,所有做了几次尝试,总算弄懂怎么个用法了。语法如下:sp_executesql [@stmt =] stmt[ {, [@params =] N'@parameter_name data_type [,...n]' } {, [@param1 =] 'value1' [,...n] }]stmt为要执行的字符串,@params为字符串中引用到的变量,@param1为引用到的第一个变量,如果@params中含2个或者2个以上的变量,那自然有@param2,@param3了。示例如下: 阅读全文
摘要:
元数据 (metadata) 最常见的定义为"有关数据的结构数据" 系统存储过程 描述 sp_columns 返回指定表或视图的列的详细信息。 sp_databases 返回当前服务器上的所有数据库的基本信息。 sp_fkeys 若参数为带有主键的表,则返回包含指向该表的外键的所有表;若参数为带有外键的表名,则返回所有同过主键/外键关系与该外键相关联的所有表。 sp_pkeys 返回指定表的主键信息。 sp_server_info 返回当前服务器的各种特性及其对应取值。 sp_sproc_columns 返回指定存储过程的的输入、输出参数的信息。 sp_statistics 阅读全文
摘要:
SQLServer时间日期函数1.dateadd 在向指定日期加上一段时间的基础上,返回新的 datetime 值 例如:向日期加上2天 select dateadd(day,2,'2004-10-15') --返回:2004-10-17 00:00:00.0002. datediff 返回跨两个指定日期的日期和时间边界数。 select datediff(day,'2004-09-01','2004-09-18') --返回:173. datepart 返回代表指定日期 的 指定日期部分。 SELECT DATEPART(month, ' 阅读全文