欢迎来IT培训班!

咨询热线 18940085928

IT培训网 > 深圳IT培训 > 深圳大数据培训 >

深圳大数据Spark实战培训班

授课机构:IT培训班

地址:北京

网报价格:详询

课程原价:

咨询热线:18940085928

课程详情 相关推荐 学校地址 网上报名

课程亮点


师资:*讲师团队,丰富行业经验和企业培训经验



特色:小班培训,精品课程,面授+直播+录播,上课方式多样



培训:免费重听



适用对象


不限



学习目标
了解大数据业内*新发展趋势,深入掌握Hadoop的原理,Hadoop生态系统



课程内容


大数据背景与思维



1. 什么是大数据



2. 大数据技术的产生背景



3. 大数据应用场景



4. 大数据思维



5. 大数据产业链



6. 大数据是如何变革各行业的技术架构、商业模式和组织方式



7. 大数据必备的技术基础



*天



互联网电信大数据应用案例深度解析



大数据在通信及互联网行业的应用案例解析-以下几个案例将贯穿整个培训内容, 作为每个章节的案例分析细化到每个大数据的知识点



互联网企业遇到大数据的问题



案例分享:海量数据通信行业解决方案



案例分享:基于通信网元实时数据的海量数据解决方案



案例分享:*电信用户画像分析系统的大数据变现案例分析



案例分享:淘宝大数据分析案例分析



*天



海量数据处理系统



的架构设计



这个部分主要讲解海量数据处理的架构设计,针对海量数据的问题设计海量数据的架构解决方案。



海量数据处理的系统场景



大数据时代的数据架构解决方案



海量数据处理的架构汇总



8种海量数据处理的架构设计比较



分布式系统架构的海量数据处理设计



海量数据处理设计



典型案例分析:结合一个500强实时数据系统的实例案例进行分析,详细分析海量数据处理的架构设计



第二天



案例及动手实验



HDFS实战-Java API使用



PB 级大数据存储系统的项目案例分析



HDFS部署、配置与性能调优实战



典型案例分析:通过HDFS API完成一个复杂数据系统的操作过程



Hadoop MapReduce深入解析



使用 Hadoop MapReduce Streaming 编程



MapReduce流程



基本MapReduceAPI 概念



MapReduce的优化



MapReduce的任务调度



MapReduce编程实战



满足解决实际数据分析问题的高级Hadoop API



第三天



Hive架构及实践案例沙盘演练



Hive系统部署与搭建



Hive工作机制



基于Hive的大数据加载过程



Hive程序编写性能建议



MapJoin



数据倾斜



Join顺序



UDF编写注意事项



快速获取结果TopN



通过Explain观察Hive行为



动手实验:完成Hive的搭建与配置



典型案例分析:基于Hive的大型电信通话记录分析示例,详细分析Hive的架构应用、性能调优及其使用场景与整体系统架构的结合



第四天



Spark架构及实践



案例沙盘演练



1.2 Spark的重要扩展



1.2.1 Spark SQL和Dataframe



1.2.2 Spark Streaming



1.2.3 Spark MLlib和ML



1.2.4 GraphX



1.2.5 SparkR



2.3 运行Spark应用程序



2.3.1 Local模式运行Spark应用程序



2.3.2 Standalone模式运行Spark应用程序



2.3.3 YARN模式运行Spark



2.3.4 应用程序提交和参数传递



3 Spark程序开发



3.1 使用Spark Shell编写程序



3.1.1 启动Spark Shell



3.1.2 加载text文件



3.1.3 简单RDD操作



3.1.4 简单RDD操作应用



3.1.5 RDD缓存



3.2 构建Spark的开发环境



3.2.1 准备环境



3.2.2 构建Spark的Eclipse开发环境



3.2.3 构建Spark的IntelliJ IDEA开发环境



3.3 独立应用程序编程



3.3.1 创建SparkContext对象



3.3.2 编写简单应用程序



3.3.3 编译并提交应用程序



第五天



Spark Streaming应用开发



Spark Streaming Java实例开发、运行



Spark Streaming Java实例的运行过程分析



Spark Streaming内部数据传输过程分析



Spark Streaming应用开发总结(API回顾,典型应用模式总结)



Spark Streaming消息可靠性保证机制介绍



Spark Streaming实时大数据算法解析案例



Spark Streaming实时大数据报警案例



Spark Streaming实时大数据的调整与改进
  • 学校名称:IT培训网

    固定电话:18940085928

    授课地址:线下 预约名额

报名信息