실습 과정

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/ed707885-7500-4839-9553-dfc4599f768d/SPARK__(2).jpg

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/8d3a65dd-ae30-4f3e-984d-94de7daf4fe1/SPARK__(3).jpg

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/e91bce8d-9706-461e-b5c4-b8d067fffbd6/SPARK__(1).jpg

우리는(이병준 외 1명) leelee's라는 소규모 study group을 하고있다.

Kakao에서의 채용사례가 카카오 공용 하둡기반의 클러스트로 관리하는 것처럼 세상이 빅데이터 활용에 눈여기고 있다. 이번 활동은 하둡,SPARK,Zepplin을 이용해서 지역별 기관지율을 분석하고 학습하도록 하였다. 우리가 사용한 데이터는 공용 진찰기록 데이터를 사용하여 'J'로 시작하는 기관지 관련 질병코드들을 조사하여 분석하였다.

사용한 프로그램은 위의 실습 과정과 동일하게 하둡, SPARK, Zepplin을 순서대로 쌓아올려 사용하게 되었다.

결과적으로, 지역별 기관지관련 질병에 걸린 인원을 분석할 수 있었다.

카카오(Kakao) 빅데이터 경력직 채용 사례

카카오 빅데이터 경력직 채용 사례

실습 파일

빅데이터.zip