学完收获:熟练使用DS、Oozie、AirFlow等任务调度工具,完成大数据任务调度熟悉Linux基本操作,完成分布式虚拟机搭建任务了解数据仓库开发从需求沟通、标签定义、编码开发、整个流程能够掌握Python语言基础,利用Python语言完成常见编程任务能够掌握Pandas数据处理和数据分析的工作能够掌握Java语言基础,利用Java完成MapReduce编程,Flink任务编程熟练掌握Hadoop生态体系,掌握MapReduce原理及优化技巧熟悉掌握Spark生态技术栈,利用SparkCore基础数据处理能够使用SparkSQL完成大数据数据处理及统计分析能够掌握Hive基础内容,利用HiveSQL完成基础数据仓库构建能够利用Spark?On?Hive完成企业级离线数据处理及统计工作熟练Mysql数据库,有使用一种ETL方式经验优先完成Spark/Hadoop/HBase/Kafka/Flink等组件的搭建能够基于Flink进行实时分析和离线分析掌握Flink核心4大特性能够基于FlinkSQL完成常见大数据统计分析任务能够使用Hbase完成大数据异构数据存储能够掌握Kafka消息队列基础使用能够掌握Kafka和Flume对接完成实时数据采集工作熟练使用FineBi等BI工具完成数据展示任务