沈阳大数据培训班,帮助学员从基础入门,知识点由浅入深,由难到易,逐步深入,通过北美专家直播授课+多师型师资配合管理,在6个月掌握实用的大数据技术项目经验,成为企业抢手大数据软件工程师。
认识了解大数据
课程介绍
Big data 大数据简介
Big data
对于“大数据”(Big data),研究机构Gartner给出了这样的定义:“大数据”是需要 新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长 率和多样化的信息资产。
麦肯锡全球研究所给出的定义是:一种规大到在获取、存储、管理、分析方面大大超 出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流 转、多样的数据类型和价值密度低四大特征。
大数据已然来袭,你还在等什么?
随着互联网科技发展,大数据在生活中应用无处不在,大数据人才需求急剧上升,职业前景具有无限上升空间。
1. 搜索引擎
2. 交通出行
3. 金融分析
4. 学习培训
5. 数据挖掘
6. 影像创意
7. 娱乐消费
8. 信息推送
大数据课程内容安排
小班授课、源码分析、动手实操、0基础小白轻松掌握的大数据培训课程
课程大纲 核心技能点 核心能力培养
第一阶段:Java基础 Java基础语法、面向对象、异常处理、集合框架、常用类、I/O操作、多线程、网络编程、XML解析
深刻理解面向对象思想,掌握JavaEE核心技术并能灵活运用Java常用API解决实际问题,具备了程序员必备的逻辑思维能力及自学能力,为后续深入学习JavaWeb技术及框架技术打下牢固的基础。 熟练使用MyElipse开发Java程序
会使用Java编写常用的流程控制语句
理解并掌握面向对象思想及其三大特性
能够灵活运用Java常用类解决实际问题
会使用集合框架存储数据、I/O技术操作文件
能够实现多线程及网络编程
第二阶段:JavaWeb网站开发 HTML5、CSS3、JavaScript/ES6、JQuery、JSP/Servlet、MySQL数据库、JDBC、Linux、SVN
能够完成B/S架构的中小型网站系统的开发,并在真实生产环境下进行项目发布 了解B/S架构运行原理
掌握网页的开发和设计技能
掌握JavaWeb核心开发技能
掌握Linux应用部署和监控技能
掌握基本的JavaEE应用设计和开发技能
锻炼学员团队协作能力
第三阶段:SSM/SSH框架 MyBatis框架、Spring框架、Spring MVC框架、Struts2框架、Hibernate框架、Git、Maven 、Oracle数据库
能够胜任垂直架构下的Java开发工作,熟练使用流行的开发框架SSM、SSH进行传统企业级项目开发。 掌握SSM/SSH框架核心技能及应用开发技能
掌握Oracle数据库设计和应用技能
学会使用Git进行项目代码版本管理
学会使用Maven进行项目构建管理
第四阶段:基于分布式微服的互联网架构 分布式微服架构、Dubbox、Spring Cloud、Spring Boot、Docker环境快速搭建实现自动化部署、分布式下ID唯一性、Redis、分布式事务处理、分布式下三方接入、Active MQ消息队列等
能够胜任互联网公司的分布式项目的开发和架构设计工作 培养学员基于分布式项目的业务架构、应用架构、技术架构、安全架构、网络拓扑架构等的设计和代码开发能力,以及在部署策略等方面的综合能力
培养学员分布式项目下核心业务处理能力
培养学员在分布式项目下对于高并发、数据最终一致性、性能优化等问题的解决处理能力
第五阶段:Python爬虫+ELK+分析 Linux Shell编程、Python编程、NumPy&Pandas、Scrapy、LXML、PySpider、数据采集、整理和清洗、Elasticsearch、Logstash、Kibana
能够胜任Python开发工程师、爬虫工程师、搜索引擎工程师。 掌握Python编程
具备Python的爬虫开发、 数据获取和整理等能力
能够使用ELK进行数据导入、 查询和集成
第六阶段:Hadoop生态圈 HDFS、MapReduce、YARN、Hive、Sqoop、HBase
能够胜任:Hadoop工程师、ETL工程师、Hive工程师、数据仓库工程师。
掌握Hadoop集群配置与管理
掌握HDFS文件操作
掌握分布式计算原理
掌握基于Hive的数据ETL和数据查询
掌握HBase数据存储
掌握数据导入导出
第七阶段:Spark技术栈 Scala编程、Spark RDD、Spark SQL、Spark GraphX、PySpark、Jupyter、Hadoop数据模型、Atlas&Ranger、NiFi、Kafka、Oozie、Cassandra&Hive、Redis&Hive、MongoDB、Tableau
能够胜任:Spark工程师、Hadoop工程师、ETL工程师
掌握Spark集群配置与管理,以及Spark离线计算
具备Scala和Python编写 Spark应用的能力
具备在企业数据湖中建立数据流程/通道、实施数据监管、规范数据管理和确保数据安全
具备数据采集、数据变换、数据建模、任务调度以及与企业应用的数据集成的能力
具备多种NoSQL数据存储的能力
掌握Hive/Spark实施数据变换、BI工具与 Hive、 NoSQL 的集成
掌握用户兴趣取向分析/航班飞行网图分析/电子商务消费行为分析/用户交易欺诈分析案例的具体实现
第八阶段:实时流处理平台 Spark Streaming、Flink、Flume、Storm、d3.js、Echarts
能够胜任:大数据开发工程师、大数据架构师 掌握Apache NiFi/Kafka/Flume/Spark Streaming的集成使用
具备实时流数据存储、计算、查询的能力
具备多种流处理框架的运用能力
掌握多种常见可视化工具的使用
掌握股票流数据实时分析/舆情分析案例
第九阶段:机器学习 Spark Mllib
能够胜任:大数据架构师、大数据初级分析师、大数据挖掘工程师
掌握Spark机器学习数据结构及流程
掌握分类,聚类和推荐模型
掌握垃圾邮件分类