ETL课程大纲
|
|||
课程阶段
|
课程模块
|
课程内容
|
|
数据库阶段
3周 |
ORACLE关系型数据库基础概论
|
SELECT 查询语句、限制和排序数据、单行函数及自定义输出格式、转换函数与条件表达式、分组函数以及聚合操作、多表查询操作、使用子查询、Set集合操作、DML与事务处理操作、DDL语句
|
|
Oracle 11g体系简介、Oracle 11g数据库安装、创建数据库、管理数据库实例、Oracle存储管理、管理数据库用户、数据和并发处理、管理还原、管理安全性、数据库主动性管理、数据库性能调优、备份和恢复的概念、实施备份、实施恢复、数据移动
|
|||
体系结构、SQL PLUS基础、SQL语言基础、PL/SQL基础、PL/SQL高级应用、视图、同义词、序列、触发器的设计、安全管理.、表空间的管理、表的管理、SQL Loader的使用、OEM、监听程序及服务的配置、数据库备份与恢复
|
|||
PL/SQL
(PL/SQL语法、定义变量、条件控制语句、循环语句、触发器创建、使用Oracle内置程序*、编写匿名块、函数、过程、程序*、管理子程序、异常处理、理解和影响PL/SQL编译器、动态SQL) |
PL/SQL介绍、声明PL/SQL变量、编写可执行语句、编写与ORACLE服务器交互的代码、PL/SQL控制结构语句(IF,CASE条件判断、Loop循环语句)、%ROWTYPE、INDEX BY Tables等符合数据类型、使用显示游标、程序异常处理、存储过程编写、存储函数及debug、程序*、部署程序*、在代码中调用Oracle内存程序*、动态SQL语句、PL/SQL设计注意事项、触发器编写、编写DLL事件触发器、PL/SQL编译器、管理PL/SQL代码、维护程序代码相关性
|
||
Mongodb
|
mongodb的安装及启动、mongodb的数据存储结构、高级查询技巧、mongodb索引优化、mongodb主从副本集(replica set)、mongodb分片(sharding)、数据导入与导出、性能监控与运维管理
|
||
数据仓库阶段
2周 |
数据仓库概论及ETL
|
数据仓库设计概览、数据仓库性能调优注意事项、Oracle分区概览及实施、并行概念、数据仓库中的查询\DML\DDL并行操作、利用Oracle数据库工具实现ETL中抽取过程、利用Oracle数据库工具实现ETL中的转换过程、利用Oracle数据库工具实现ETL中的加载过程、物化视图基础、刷新物化视图、使用维对象、物化视图查询重写技术
|
|
Informatica
PowerDesigner |
企业数据集成概览、利用ETL导入数据到数据库仓库和数据集市、Informatica数据集成系统体系简介、管理PowerCenter资料库、使用PowerCenter资料库、使用PowerCenter Designer设计ETL、*流管理与*流监控、转换操作、创建*流
|
||
大数据阶段
3周 |
Hadoop数仓
|
Cloudera Manager的安装与配置、Ddfs和MapReduce基本原理、hue的使用、hive、impala、oozie
|
|
数据计算
3周 |
Python
|
python安装与配置、ipthon notebook的安装使用、python(pycharm)开发环境配置、Package以及数据类型、数据结构:列表(List)、数据结构:元组(tuple)、列表(List)与元组(tuple)的对比、字典 (Dictionary)、函数 (Function) 、控制流: if & for 语句、while & range语句、break, continue & pass、输入输出方式介绍(Output Format)、读写文件(File IO)、错误与异常处理(Error & Exceptions)、面向对象编程(Object-Oriented)和装饰器(decorator)、图形界面(GUI)
|
|
python scrapy爬虫框架简单应用
|
|||
项目案例
5周 |
基于Hadoop大数据架构数仓ETL及用户画像体系
|
数据质量分析、逻辑模型设计、物理模型设计、ETL开发设计、用户标签设计、RFM模型分析及指标计算
|