沈阳大数据培训中心

授课机构：IT培训班

地址：北京

网报价格：详询

课程原价：

咨询热线：18940085928

网上报名

在线咨询

课程详情相关推荐学校地址网上报名

第一阶段 JavaSE-

主题主要内容

Java基础语法

计算机理论介绍

编程基础--进制分类,进制转换等

JDK的安装与环境变量的配置

注释

数据类型

标识符

变量和常量

转义字符

数据类型转换

常用运算符

分支流程控制-if

分支流程控制-switch

循环流程控制-while

循环流程控制-for

方法的定义与调用

方法的参数与返回值

方法的重载

方法的递归

数组的定义与元素访问

数组的内存分析

数组的常见操作

数组排序

Java面向对象

面向对象与面向过程

类的设计

对象的实例化

对象的内存分析

类中成员的访问

类是一种自定义的类型

this关键字

包(package)的创建与使用

构造方法

private关键字与属性封装

单例设计模式

继承基本的概念

继承中的特点

继承中的构造方法

方法的重写

final关键字

super关键字的使用

Object类

对象的转型

instanceof关键字

抽象类与抽象方法

接口

常用类、异常、集合

Lambda表达式

内部类

包装类型

常用类Random、Date、SimpleDateFormat、Calendar

枚举

异常定义

常用结构.

finally关键的应用

自定义异常

String类常用方法

StringBuffer/StringBuilder的常用方法

正则表达式

集合框架Collection

集合中元素排序

Collections工具类

泛型

集合框架Map

HashMap集合

TreeMap集合

可变参数

Arrays工具类

基本数据结构

Java多线程和IO

多线程概念

并发与并行

创建线程的方式

线程常用方法

线程生命周期

临界资源问题

同步代码段synchronized关键字

同步方法synchronized关键字

lock和unlock

线程死锁

生产者消费者设计模式(一对一)

懒汉式单例设计模式中的线程安全问题

File常用方法

流的基础

流的分类

字节流

字符流

转换流

缓冲流

对象流

Properties文件操作

NIO和NIO.2（缓冲区、通道、Paths.get、Files）

Class类

Class获取对象的三种方式

Constructor构造方法

Field 属性

Method方法

反射实例

MySQL+JDBC

SQL简介

SQL表的概念

数据库的安装卸载

登录MySQL和MySQL常用命令

MySQL中常用的基本数据类型

数据库DDL操作

数据库DML操作数据库DQL操作

数据库DQL操作

数据完整性

数据库的索引操作

表与表之间的关系

多表查询

常见函数应用

数据备份与恢复

JDBC原理

JDBC的实现

JDBC实例-模拟登陆

SQL注入问题

xml和json讲解

数据库事务

连接池

连接池原理

常用的三方连接池DBCP、C3P0和Druid

DBUtils三方工具的使用

第二阶段 Hadoop生态-

主题主要内容

Linux和Shell脚本 CentOS 7.7安装部署

常见文件操作命令

常用系统操作命令

常用的四种软件安装部署

Shell脚本中变量

Shell脚本数组、if-el分支、循环和方法等

Shell脚本调试

crontab定时器

HDFS分布式文件系统 HDFS组件概述

Hadoop安装部署

HDFS中的服务功能

HDFS工作机制

HDFS读写流程

HDFS的api操作

Zookeeper Zookeeper的定义

Zookeeper的应用场景

Zookeeper的服务及功能

Zookeeper整体架构

Zookeeper的选举机制

Zookeeper中事务

Zookeeper安装部署

Zookeeper操作

HDFS的HA部署

MapReduce YARN的组件

YARN的架构

YARN的调度方式

YARN工作原理

MapReduce模型

MapReduce中shuffle机制

MapReduce中的partitioner

MapReduce中的自定义输入输出

MapReduce中的join操作

MapReduce中的压缩

MapReduce优化

Hive Hive架构

Hive安装部署

Hive的DDL操作

Hive的DML操作

Hive分区

Hive分桶

Hive数据加载

Hive中数据类型

Hive的常见内部函数

Hive自定义函数(UDF|UDAF)

Hive视图

Hive索引

Hive优化

Presto Presto部署

Presto命令行接口

Presto的JDBC驱动

Presto队列配置

Presto的连接器

Presto的函数和运算符

Presto的数据类型

Presto的sql操作

Presto从Hive迁移

Presto的函数

Hbase Hbase架构

Hbase组件

Hbase工作原理

Hbase的shell操作

Hbase的api操作

Hbase的合并

Hbase的触发器

Hbase的过滤器

Hbase的RowKey设计

Hbase的优化操作

Phoenix Phoenix安装部署

Phoenix的四种操作方式

Phoenix的DDL和DML

Phoenix的视图

Phoenix的二级索引

Phoenix的分页实现

Kylin Kylin架构

Kylin安装部署

Kylin数据源添加

Kylin的Mode创建

Kylin的Cube构建

Kylin的Cube运行

Kylin的支持的操作

Kylin的优化

Sqoop Sqoop架构

Sqoop安装部署

Sqoop的工作原理

Sqoop的Import和Export

Sqoop增量和全量操作

Sqoop元数据

Sqoop的Job操作

Sqoop代码脚本化

Flume Flume架构

Flume安装部署

Flume的source、channel、sink

Flume的selector使用

Flume的实时采集

Flume自带拦截器和自定义拦截器

Flume多agent部署

Flume的容错

Azkaban Azkaban架构

Azkaban部署

Azkaban的Shell案例

Azkaban的MapReduce案例

Azkaban的Hive案例

Azkaban的Sqoop案例

Azkaban的定时案例

Azkaban的2.0语法

Azkaban的用户和权限

Azkaban的优化

Git Git相关概念

Git安装部署

Git命令行操作

Git版本库创建

Git中分支操作

Git冲突解决

GitHub和GitLab介绍使用

Git和IDEA整合使用

数据仓库数据仓库定义

数据仓库四大特征

数据仓库主题

数据仓库集市

数据粒度

数据仓库中维度

数据仓库中缓慢数据变化处理

数据仓库分层

第三阶段 Spark生态-

主题主要内容

Scala基础 Scala环境部署

编码规范

var和val的区别

数据类型

表达式

循环

定义方法和函数

数组(Array)

映射(Map)

元组(Tuple)

列表(List)

Set

集合的重要函数

类、特质、抽象类、对象、继承

模式匹配和样例类

高阶函数

隐式转换和隐示参数

泛型

Netty的概念

Spark Core Spark简介

Spark运行模式

SparkShell

RDD的概念详解

Transformation算子

Action算子

DAG有向无环图

RDD任务的切分

Lineage(血统)

Checkpoint检查点机制

Spark集群启动流程和任务提交流程

自定义排序

自定义分区

Accumulator累加器

Broadcast广播变量

Shuffle原理剖析与源码分析

SparkSubmit执行流程

集群启动流程详解

SparkContext执行流程

Task提交流程详解

Stage划分过程详解

Spark内核源码 Spark启动脚本解析

Spark提交流程解析

应用提交和Driver进程

SparkContext解析

Spark executor解析

Spark的部署模式

Spark的shuffle流程

Spark的内存管理

Spark SQL SparkSQL介绍

SparkSQL的操作方式

SparkSQL的数据抽象

Spark-shell基本操作

数据转换(RDD,DataFrame,DataSet)

数据操作方法(DSL和SQL)

SparkSQL自定义函数(UDF,UDAF,开窗函数)

Spark集成Hive(内置Hive和外置Hive)

Kafka消息队列 Kafka的组件介绍

Kafka集群部署

Kafka文件存储机制

topic中partitioner的分布

Kafka分区中的Segment

Kafka分区和消费者的关系

kafka日志合并

kafka的生产者案例

Kafka的消费者案例

Kafka自定义分区器

Kafka消费者组

Zookeeper如何管理Kafka

Redis Redis的应用场景

Redis安装部署

Redis数据类型的cli和api操作

Redis的数据类型和操作案例

Redis主从复制

Redis集群部署

Redis的连接池

Redis中的雪崩、穿透和击穿问题

Spark Streaming Spark Streaming的原理介绍

DStream的概念

DStream原语类型介绍

DStream的Transformation(转换)、Output(输出)

窗口操作案例实现

Spark Streaming结合Kafka案例实现

背压和反压机制

如何保证数据的一致性

Structured Streaming实战

Spark Mllib Spark MLlib简介

Spark MLlib组件介绍

Word2Vec

TF-IDF

ALS

GBDT

MinMaxScaler

OneHotEncoder

Elasticsearch Elasticsearch的相关概念

Elasticsearch及插件安装部署

Index的概念

Document的概念

Mapping映射的概念

Elasticsearch的数据类型

Elasticsearch的聚合操作

索引rest和api相关操作

Elasticsearch的SQL操作

Elasticsearch过滤器

IK分词器集成Elasticsearch

查询文档分页操作

Kibana插件操作

ClickHouse ClickHouse概念

ClickHouse安装部署

客户端连接和JDBC方式访问ClickHouse

数据类型

ClickHouse的ddl和dml操作

ClickHouse表引擎

ClickHouse优化

第四阶段 Flink生态-

主题主要内容

Flink基础 Flink部署模式

Flink Streaming DataStream API介绍

Flink Streaming DataSource、Transformations、Sink详解

Flink的connector

Flink的自定义输入输出

Flink中两阶段提交

Flink中的操作链

Flink DataSet的DataSource、Transformations、Sink详解

Flink Table API和SQL应用

Blink Table的操作

Sql与hive的整合

Flink的序列化

Flink的广播变量

Flink的累加器

Flink的分布式缓存

Flink的状态管理和恢复

Flink的CheckPoint

Flink失败重启

Flink中Time

Flink窗口

EventTime与Watermarks

Flink的CEP

Flink的新特性

Flink的优化

IT培训网优质课程推荐

学校名称：IT培训网

固定电话：18940085928

授课地址：线下预约名额

报名信息

沈阳大数据培训中心

IT培训网优质课程推荐

友情链接

热门城市