깊게 파진않고 간략히 설명하고 중요한 부분만 짚는다.

01. 크롤링

02. ETL

03. 정형데이터/비정형데이터

04. Data Warehouse vs Data Lake

05. 데이터 스트림(Steam) vs 배치(Batch)

06. 워크플로우(Workflow)

07. Computer Cluster

08. Scale Up & Scale Out

09. SQL

10. 하둡(Hadoop)

11. 스파크(Spark)

12. 하이브(Hive)

13. NoSQL