깊게 파진않고 간략히 설명하고 중요한 부분만 짚는다.
01. 크롤링
02. ETL
03. 정형데이터/비정형데이터
04. Data Warehouse vs Data Lake
05. 데이터 스트림(Steam) vs 배치(Batch)
06. 워크플로우(Workflow)
07. Computer Cluster
08. Scale Up & Scale Out
09. SQL
10. 하둡(Hadoop)
11. 스파크(Spark)
12. 하이브(Hive)
13. NoSQL