`
文章列表

Hive hql

    博客分类:
  • hive
[Hadoop大数据]——Hive连接JOIN用例详解 http://www.cnblogs.com/xing901022/p/5804836.html   清空表数据 insert overwrite table t_table1 select * from t_table1 where 1=0;   建表 create table test_part (id int,name string,no int) partitioned by (dt string)  row format delimited fields terminated by '\t'  stored as ...

Maven Hive-Jdbc教程

    博客分类:
  • hive
Maven Hive-Jdbc教程 http://www.cnblogs.com/ae6623/p/5686504.html  http://blog.csdn.net/jethai/article/details/52345271

sqoop1.4.6安装

sqoop1.4.6安装 http://blog.csdn.net/linlinv3/article/details/49589615    sqoop import --connect jdbc:mysql://u13:3306/hive --username hive --password hive --table test --hive-import --hive-overwrite --hive-table testt --fields-terminated-by '\t'   Sqoop-1.4.4工具import和export使用详解 http://shiyanjun ...

mysql安装

    博客分类:
  • db
 
mysql在linux下的安装 http://www.cnblogs.com/bookwed/p/5896619.html   #启动mysql

Spark安装配置

  spark-1.2.0 集群环境搭建 http://blog.csdn.net/stark_summer/article/details/42458081   管理界面  http://u13:8080/   Spark Idea Maven 开发环境搭建 http://www.cnblogs.com/fillPv/p/5882364.html   scala + intellij idea 环境搭建及编译、打包 http://www.cnblogs.com/yjmyzz/p/4694219.html   Idea scala plugin   https:/ ...

Hive 三种配置方式

    博客分类:
  • hive
hive on spark安装(hive2.3 spark2.1) https://blog.csdn.net/Dante_003/article/details/72867493   Hive metastore三种配置方式 https://www.cnblogs.com/snowbook/p/5886438.html http://blog.csdn.net/reesun/article/details/8556078 (服务端,客户端及服务客户一并配置,3种样例) ...

Hadoop hdfs命令

hdfs fsck /home/hive/warehouse/music_rec.db/fact_user_events_all -files -blocks Format the filesystem: $ bin/hdfs namenode -format Start NameNode daemon and DataNode daemon: $ sbin/start-dfs.sh The hadoop daemon log output is written to the $HADOOP_LOG_DIR director ...
Hadoop2.6.2完全分布式集群HA模式安装配置详解 http://blog.csdn.net/ltliyue/article/details/51144381 http://www.open-open.com/lib/view/open1436855630959.html   Hadoop的HA集群启动和停止流程 1. hadoop-daemon.sh start namenode 主节点 2. hdfs namenode -bootstrapStandby   备节点  sbin/hadoop-daemons.sh start zkfc   Hadoop的HA集群启 ...

Linux常用命令

  用户环境变量 vi ~/.bash_profile   Linux添加/删除用户和用户组   du -sh : 查看当前目录总共占的容量。而不单独列出各子项占用的容量  du -lh --max-depth=1 : 查看当前目录下一级子文件和子目录占用的磁盘容量。     查找并删除某天前文件   find . -mtime +30 -name "*.log" -exec rm -rf {} \;   标签: Linux

Hadoop 部署

http://v.youku.com/v_show/id_XMzc5MzM1NDQw.html VMware keyNY0K2-2ULDJ-LZUP1-MV154-8363F 4F4R4-AEK53-TZYU9-KK9X4-9AWPQ Hadoop实战_1.avi 链接:http://pan.baidu.com/share/link?shareid=3449193448&uk=808459810 密码:8lw8Hadoop实战_2.avi 链接:http://pan.baidu.com/share/link?shareid=3463589493&uk=808459810 密 ...
转载:http://xumingming.sinaapp.com/410/twitter-storm-code-analysis-acker-merchanism/ Twitter Storm源代码分析之acker工作流程   概述 我们知道storm一个很重要的特性是它能够保证你发出的每条消息都会被完整处理, 完整处理的意思是指: 一个tuple被完全处理的意思是: 这个tuple以及由这个tuple所导致的所有的tuple都被成功处理。而一个tuple会被认为处理失败了如果这个消息在timeout所指定的时间内没有成功处理。 也就是说对于任何一个spout-tu ...
转载:http://xumingming.sinaapp.com/466/twitter-storm-code-analysis-zookeeper-dirs/ Twitter Storm源代码分析之ZooKeeper中的目录结构 我们知道Twitter Storm的所有的状态信息都是保存在Zookeeper里面,nimbus通过在zookeeper上面写状态信息来分配任务,supervisor,task通过从zookeeper中读状态来领取任务,同时supervisor, task也会定义发送心跳信息到zookeeper, 使得nimbus可以监控整个storm集群的状态, 从而可以 ...
转载:http://xumingming.sinaapp.com/483/twitter-storm-code-analysis-local-dir/ Twitter Storm源代码分析之Nimbus/Supervisor本地目录结构 我们知道,storm集群里面工作机器分为两种一种是nimbus, 一种是supervisor, 他们通过zookeeper来进行交互,nimbus通过zookeeper来发布一些指令,supervisor去读zookeeper来执行这些指令,具体nimbus和supervisor在zookeeper上交换了哪些信息可以看一下这篇文章: Twitter ...
转载:http://xumingming.sinaapp.com/647/twitter-storm-code-analysis-topology-execution/ 我们通过前面的文章(Twitter Storm源代码分析之ZooKeeper中的目录结构)知道了storm集群里面nimbus是通过zookeeper来给supervisor发送指令的,并且知道了通过zookeeper到底交换了哪些信息。 那么一个topology从提交到执行到底是个什么样的过程?nimbus和supervisor到底做了什么样的事情呢?本文将带你去探寻这些答案。 代码列表 nimbus.clj s ...
转载:http://xumingming.sinaapp.com/727/twitter-storm-code-analysis-tuple-send-proc/ 这篇文章里面我们来看一下Storm里面的tuple到底是如何从一个tuple是怎么从一个bolt到另一个bolt上去的。 首先Bolt在发射一个tuple的时候是调用OutputCollector的emit或者emitDirect方法, 而这两个方法最终调用的是clojure代码里面的mk-transfer-fn方法: 帮助123456 ; worker.clj (defn mk-transfer-fn [transfer-qu ...
Global site tag (gtag.js) - Google Analytics