greenplum expand

继续在上篇文章的基础上进行扩容计算节点测试,exampledb是我之前创建的用来测试的数据库,里面有两个表cpu和mem,是一些业务进程所占用CPU和内存的指标值,两个表的记录数如下: exampledb=# select count(1) from cpu; coun »

greenplum数据导入

本文在上一篇的基础上测试数据的导入。 在slave1机器上准备一份数据,格式如timestamp,value,tags: # pwd /home/gpadmin/ext_files # head -5 data.csv 1446559211,27,2395 144655922 »

安装greenplum

greenplum开源了。 本文的主要内容是记录安装greenplum测试环境的过程。 测试环境 CentOS 6.5 1台master,2台segment 192.168.15.135 master 192.168.15.190 slave1 192.168.1 »

用impala查询TSDB数据及用plot.ly来实现数据的可视化

背景 我们有个openTSDB集群,用来收集系统及应用的运维指标数据,以及分析性能问题,前端dashboard使用了metrilyx,metrilyx的优势在于可以灵活创建各种数据视图,如图,是将一台服务器的所有重要指标汇合在一个页面中: 另外,对于我们的游戏业务应用,用met »

tcollector

安装 cd /usr/local git clone git://github.com/OpenTSDB/tcollector.git 配置 # vim /usr/local/tcollector/startstop # 修改为您的TSD服务端域名或IP TSD_HOS »

安装及部署openTSDB

环境:CentOS 6.5 with CDH5 采用rpm包来安装,省时省力。如果按照官网上的源码安装,需要设置好java相关的环境变量,另外在安装过程中安装脚本还要下载很多其他依赖包来编译。 wget -c https://github.com/OpenTSDB/opentsd »

sed截取特定行内的内容

很久没有做过sed相关的练习了,近几天遇到了这样的一个练习,要截取特定行内的内容,比如一个配置文件如下: root@ubuntu:~# cat conf.ini {configure_a, [ {10.10.10.1,0}, {10.10.10.1,1}, »

impala的python客户端impyla

依赖条件: gcc make git setuptools 安装: git clone https://github.com/cloudera/impyla.git cd impyla python setup.py install 使用 >>> »

hive与tsdb整合的初步设想

hive可以读取hbase的数据,需要用到StorageHandlers,暂时还没有时间去看这方面的资料,于是借着这段时间看hive的成果,尝试先将tsdb信息导出到文本中,然后将文本文件导入hive表中。 tsdb数据查询接口 使用tsdb query接口: # ./tsdb »

离线安装CDH5

本文主要记录在测试环境中安装CDH的步骤。本文中的hadoop集群有1个namenode,3个datanode。 CDH本地源准备 国内从cloudera官方源上安装实在太慢了,因此我们做了个本地源,部署源的注意事项主要有3点: 在另外一台机器上拉取 http://archive »