中国云计算服务网
云资讯 产业资讯
产品资讯 服务资讯
评测资讯
云设备 云服务器
云终端 云存储设备
云安全 负载均衡
云服务 云主机
云存储 云会议
云开发 云笔记
行业云 金融云 渲染云
政府云 教育云 媒体云
医疗云 工业云 电商云
333
当前位置:云计算学习 - 云书籍 - 云计算大数据处理

云计算大数据处理

作者:刘鹏 于全 杨震宇 陈伟 王磊 张乃甜
出版社:人民邮电出版社
出版时间:2015
录入时间: 2015-08-12 阅读次数:1900
shuji

内容简介

在线试读:  www.cloudguide.com.cn/url.php

图书链接:  www.cloudguide.com.cn/url.php

图书描述

     《云计算大数据处理》介绍了基于云计算的大数据处理技术,重点介绍了一款高效的、实时分析处理海量数据的强有力工具——数据立方。数据立方是针对大数据处理的分布式数据库,能够可靠地对大数据进行实时处理,具有即时响应多用户并发请求的能力。

    《云计算大数据处理》通过对当前主流的大数据处理系统进行深入剖析,阐述了数据立方产生的背景,介绍了数据立方的整体架构以及安装和详细开发流程,并给出了4个完整的数据立方综合应用实例。所有实例都经过验证并附有详细的步骤说明,无论是对于云计算的初学者还是想进一步深入学习大数据处理技术的研发人员、研究人员都有很好的参考价值。

编辑推荐
 
    1.理论基础和新技术成果的综合体;
    2.科研工作的理想参考书;
    3.科研项目的技术成果;
    4.本书作者所在的团队多年来一直致力于云计算与大数据方面的相关研究,已承担过多项重点科研项目,具有从理论到工程实践的相关基础。
    5.本书作者所在的研究团队与多家企业建立了紧密的联合研究关系,研究内容紧跟市场需求和技术发展,研究成果能够迅速转化成生产力。
    6.本书作者是中国电子学会云计算专家委员,在云计算研究方面有相当多的研究成果。

作者简介

    刘鹏,1970年生,男,博士,解放军理工大学教授。以第一作者编著中文专著一部:《云计算》,由电子工业出版社于2010年出版。
    于全,中国工程院院士,中国电子系统设备工程公司研究员,西安电子科技大学、北京邮电大学兼职教授、博士生导师。曾获国家进步一等奖1项、二等奖1项,部级科技进步一等奖4项。发表学术论文近百篇。
    杨振宇,南京云创存储科技有限公司云处理部门经理在将大数据技术与互联网业务相结合、搭建、优化及维护超大规模集群方面,有丰富的实战经验。
    陈伟,长期致力于大数据处理相关技术的研发,对开源大数据平台Hadoop及其相关技术有非常深入的研究,并积累了大量源码阅读和分析的技巧与方法。
    王磊,中国矿业大学硕士毕业,专注于分布式平台下大数据计算任务的调度和可靠性研究。发表多篇分布式环境下任务调度和可靠性论文,并被EI检索。
    张乃甜,自身Java研发工程师,现任江苏天泽信息产业有限公司研究院大数据平台研发工程师,对分布式系统、Java虚拟机和Java程序优化等都有深入的研究,并在大量实践和工作中积累了丰富的经验

目录

第1章 大数据挑战
1.1 当前面临的大数据挑战
1.1.1 大数据急剧膨胀
1.1.2 大数据智能分析
1.1.3 大数据深度挖掘
1.1.4 业务与技术脱节
1.2 大数据催生云计算
1.2.1 云计算不是偶然
1.2.2 云计算带来挑战与机遇
1.2.3 云计算对大数据的意义
1.2.4 云计算未来展望
1.3 大数据存储
1.3.1 存储仅是第一步
1.3.2 行存储还是列存储
1.3.3 PB级大数据存储
1.3.4 大数据存储的未来
1.4 大数据处理
1.4.1 大数据处理的瓶颈
1.4.2 大数据处理的需求
1.4.3 大数据处理技术决定未来
1.4.4 大数据处理解决方案
第2章 当前的大数据处理系统
2.1 开源大数据处理平台
2.1.1 Hadoop
2.1.2 MapReduce
2.2 NoSQL数据库
2.2.1 Google BigTable 的开源JAVA实现:HBase
2.2.2 纯分布式数据库:Cassandra
2.2.3 NoSQL数据库的应用场景
2.3 数据仓库平台
2.3.1 Hive
第3章 数据立方简介
3.1 数据立方产生背景
3.2 相关技术
3.2.1 云计算中的大数据处理技术--MapReduce
3.2.2 并行数据库技术
3.2.3 云计算与数据库相结合的技术
3.3 新一代EB级云计算数据库--数据立方
3.3.1 数据立方的体系架构
3.3.2 数据立方与Hadoop的关系
第4章 数据立方及配套环境的安装
4.1 安装流程
4.2 操作系统的安装
4.2.1 CentOS6.3的安装
4.2.2 安装JDK
4.2.3 配置SSH
4.3 HADOOP的安装
4.3.1 Hadoop的版本
4.3.2 HDFS的配置安装
4.3.3 MapReduce的配置安装
4.4 数据立方的配置安装
4.4.1 安装mysql-connector
4.4.2 编辑数据立方的配置文件
4.4.3 数据立方的启动
4.5 监控工具GANGLIA的安装
4.5.1安装依赖
4.5.2 安装ganglia
4.5.3 配置ganglia
4.6 数据导入工具SQOOP的安装
4.6.1 安装前提
4.6.2 安装步骤
第5章 hello word数据立方快速入门
5.1 智慧交通数据处理实例
5.1.1 智慧交通数据处理实例背景
5.1.2 建表
5.1.3 数据入库
5.1.4 数据查询
5.2 编程实现
5.2.1 JAVA开发包
5.2.2 示例
5.3 总结

第6章 数据立方开发
6.1 开发说明
6.2 数据立方SQL规范
6.2.1 数据定义与数据操作语言
6.2.2 数据查询语言
6.3 数据入库接口开发
6.3.1 单条多条记录入库JAVA开发包
6.3.2 开发说明
6.3.3 示例
6.4 数据查询接口开发
6.4.1 JAVA开发包
6.4.2 接口介绍
6.4.3 示例
6.5 数据导入工具SQOOP的使用
6.5.1 SQOOP命令
6.5.2 SQOOP命令的使用
第7章 数据立方的维护
7.1 HDFS的维护
7.1.1 HDFS的dfsadmin命令
7.1.2 HDFS的balancer工具
7.2 SHELL的使用
7.2.1数据立方SHELL说明
7.2.2数据定义与数据操作的shell
7.2.3数据查询的shell
7.3 数据立方的常见问题及其解决方法
7.3.1 启动时的常见问题
7.4 Sqoop的常见问题及其解决方法
7.4.1 Mysql的用户问题
7.4.2 Mysql的权限问题
7.4.3 Mysql的path问题
7.4.4 Mysql的path问题
7.5 数据立方管理系统
第8章 数据立方的可靠性
8.1 Hadoop的可靠性
8.1.1 HDFS中NameNode单点问题
8.1.2 HDFS数据块副本机制
8.1.3 HDFS心跳机制
8.1.4 HDFS负载均衡
8.1.5 MapReduce容错
8.2 Hadoop的SecondaryNameNode机制
8.2.1磁盘镜像与日志文件
8.2.2 SecondaryNameNode更新镜像的流程
8.3 Avatar机制
8.3.1 系统架构
8.3.2 Avatar元数据同步机制
8.3.3 故障切换过程
8.3.4 Avatar运行流程
8.3.5 Avatar故障切换流程
8.4 Avatar实战
8.4.1 实验环境
8.4.2 编译Avatar
8.4.3 Avatar安装和配置
8.5 数据立方可靠性
8.5.1 数据立方的可靠性
8.5.2 数据立方的工作流程
8.5.3 数据立方的可靠性
第9章 数据统计分析实例--供电信息采集系统
9.1 客户需求分析
9.1.1 测试过程及数据量描述
9.1.2 测试过程分解及效率统计
9.2 数据表设计
9.3 查询语句设计与结果展现
9.4 查询优化
9.4.1 存储方面的优化
9.4.2 内存方面的优化
9.5 性能测试结果
9.5.1 数据下载解压及标记
9.5.2 数据解析入库
9.5.3 数据计算流程
9.5.4 数据导入ORACLE数据库
9.5.5 查询总时长统计
第10章 在线数据检索实例--移动信令分析云平台
10.1 需求分析
10.2 数据表设计
10.2.1 CDR数据文件的检测与索引创建任务调度
10.2.2 从HDFS读取数据并创建索引
10.2.3 查询CDR信息
10.3 查询语句设计与结果展现
10.3.1 CDR文件检测和索引创建任务调度程序
10.3.2 读取CDR数据和索引创建处理
10.3.3 CDR查询
10.4 查询优化
10.5 性能测试结果
第11章 实时数据处理实例-地震数据
11.1 需求分析
11.2 数据表分析
11.3 查询语句设计与结果展现
11.4 查询优化
11.4.1 存储方面的优化
11.4.2 计算方面的优化
11.5 性能测试结果
11.5.1 单机模拟集群测试
11.5.2 字段测试
11.5.3 排序测试
11.5.4 随机读取测试

 

更多

我要评论

评论: