하둡완벽가이드 ch6. 맵리듀스 작동 방법

49
Hadoop The Definitive Guide Ch.6 How MapReduce Works 아꿈사 cecil 13831토요일

Upload: hyeonseok-choi

Post on 20-May-2015

3.573 views

Category:

Technology


1 download

DESCRIPTION

하둡 완벽가이드 챕터6. 맵리듀스 작동 방법

TRANSCRIPT

Page 1: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Hadoop The Definitive GuideCh.6 How MapReduce Works

아꿈사cecil

13년 8월 31일 토요일

Page 2: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Anatomy of A MapReduce Job Run

13년 8월 31일 토요일

Page 3: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Map Reduce 3가지 동작방식

• local• 단일 JVM에서 전체 잡을 실행• 작은 데이터 셋으로 맵리듀스 프로그램을 실행하거나, 테스트

하는 목적에 적합

• classic• 잡 트래커와 태스크 트래커를 사용하는 맵리듀스 1

• YARN• 새로운 프레임워크 맵리듀스 2

13년 8월 31일 토요일

Page 4: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Map Reduce I

13년 8월 31일 토요일

Page 5: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

주요 컨포넌트• 클라이언트

• 맵 리듀스 잡을 제출

• 잡 트래커• 잡 수행 과정을 조정• JobTracker를 주 클래스로 하는 자바 응용 프로그램

• 태스크 트래커• 잡에 대한 분할된 태스크를 수행• 자바 응용 프로그램으로서 TaskTracker를 주 클래스로 함

• 분산 파일 시스템 (HDFS)• 각 단계들 간에 잡 파일을 공유하기 위해 사용

13년 8월 31일 토요일

Page 6: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

7KH�MRE�VXEPLVVLRQ�SURFHVV�LPSOHPHQWHG�E\�JobClient¦V�submitJob()�PHWKRG�GRHV�WKHIROORZLQJ�

� $VNV�WKH�MREWUDFNHU�IRU�D�QHZ�MRE�,'��E\�FDOOLQJ�getNewJobId()�RQ�JobTracker���VWHS���

� &KHFNV�WKH�RXWSXW�VSHFLILFDWLRQ�RI�WKH�MRE��)RU�H[DPSOH��LI�WKH�RXWSXW�GLUHFWRU\�KDVQRW�EHHQ�VSHFLILHG�RU� LW�DOUHDG\�H[LVWV�� WKH� MRE� LV�QRW� VXEPLWWHG�DQG�DQ�HUURU� LVWKURZQ�WR�WKH�0DS5HGXFH�SURJUDP�

� &RPSXWHV�WKH�LQSXW�VSOLWV�IRU�WKH�MRE��,I�WKH�VSOLWV�FDQQRW�EH�FRPSXWHG��EHFDXVHWKH�LQSXW�SDWKV�GRQ¦W�H[LVW��IRU�H[DPSOH��WKHQ�WKH�MRE�LV�QRW�VXEPLWWHG�DQG�DQ�HUURULV�WKURZQ�WR�WKH�0DS5HGXFH�SURJUDP�

� &RSLHV�WKH�UHVRXUFHV�QHHGHG�WR�UXQ�WKH�MRE��LQFOXGLQJ�WKH�MRE�-$5�ILOH��WKH�FRQILJ�XUDWLRQ� ILOH�� DQG� WKH� FRPSXWHG� LQSXW� VSOLWV�� WR� WKH� MREWUDFNHU¦V� ILOHV\VWHP� LQ� DGLUHFWRU\�QDPHG�DIWHU�WKH�MRE�,'��7KH�MRE�-$5�LV�FRSLHG�ZLWK�D�KLJK�UHSOLFDWLRQIDFWRU��FRQWUROOHG�E\�WKH�mapred.submit.replication�SURSHUW\��ZKLFK�GHIDXOWV�WR����VR�WKDW�WKHUH�DUH�ORWV�RI�FRSLHV�DFURVV�WKH�FOXVWHU�IRU�WKH�WDVNWUDFNHUV�WR�DFFHVVZKHQ�WKH\�UXQ�WDVNV�IRU�WKH�MRE��VWHS����

)LJXUH������+RZ�+DGRRS�UXQV�D�0DS5HGXFH�MRE

168 | Chapter 6:ಗHow MapReduce Works

맵리듀스 잡의 동작

13년 8월 31일 토요일

Page 7: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

잡 제출• Job의 waitForCompletion 메소스 수행 과정

• Job의 submit 메소드를 호출• 진행 과정을 조사하여 변경이 생기면 콘솔로 출력

• 잡 제출 과정• 잡트래커에서 새로운 잡 ID를 요청• 잡의 출력 명세를 확인• 잡에 대한 입력 스플릿을 계산• 잡수행에 필요 자원을 잡트래커 파일시스템 상의 해당 잡 ID를

이름으로 하는 디렉토리에 복사 (jar, 설정 파일, 스플릿 정보)

• 잡 트래커가 잡을 시작할 준비가 되었음을 알림

13년 8월 31일 토요일

Page 8: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

잡 초기화• 잡 트래커가 submitJob 메소드의 호출 받으면 잡을 내부 큐에 저장• 잡 스케쥴러는 큐에서 잡을 읽어서 초기화 과정을 진행

• 실행할 잡을 표현하기 위해 하나의 객체를 생성• 이 객체는 잡에 대한 태스크 뿐만 아니라 상태 및 진행 과정을 유지하기 위한 부가 정보를

캡슐화

• 초기화 과정• 공유 파일 시스템으로 부터 계산된 입력 스플릿 정보를 가져옴• 각 스플릿에 대해 하나의 맵 태스크를 생성• mapred.reduce.tasks 속성 값에 따라 이 수 만큼 리듀스 태스크를 생성

• 추가 태스크 생성• 잡 설정 태스크: 맵 태스크 실행전 잡 설정을 위해 실행

• 잡의 최종 출력을 위한 디렉토리와 태스크 출력을 위한 임시 작업 공간을 생성• 잡 청소 태스크: 리듀스 태스크 실행전 잡 청소를 위해 실행

• 태스크 출력을 위한 임시 작업 공간을 삭제

13년 8월 31일 토요일

Page 9: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

태스크 할당• 태스크 트래커는 하트비트를 보내는 단순한 루프를 수행• 하트비트는 라이브 체크 및 메시지 채널 용도로 사용됨

• 하트 비트의 일부로 태스크 수행 준비가 되었는지 여부를 전달• 하트비트의 응답으로 할당된 테스크 전달

• 태스크 트래커는 맵 및 리듀스 태스크를 위한 많은 수의 혼합된 슬롯을

가짐• 정확한 수치는 태스크 트래커의 CPU 코어수와 메모리에 따라 결정

• 일반적으로 맵 태스크 슬롯을 리듀스 태스트 슬롯보다 먼저 채움

• 잡 트래커의 태스크 트래커 선택 기준• 리듀스 태스크는 순차적으로 선택됨. 지역성을 고려하지 않음• 태스크 트래커는 네트워크 상의 지역을 계산하여 가능하면 인접해 있는 입력 스플릿을 갖도록 선택

13년 8월 31일 토요일

Page 10: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

태스크 실행(1/2)

• 태스크 트래커의 태스트 실행 과정• 잡 JAR을 로컬 파일 시스템으로 복사• 분산 캐시로부터 필요한 모든 파일을 로컬 파일 시스템으로 복사• 태스크 실행을 위한 로컬 잡 디렉토리를 생성하고, JAR를 압축 해제• 태스크 러너 인스턴스를 생성하여 태스크를 수행

• 태스크 러너는 별도의 자바 가상 머신을 실행• 각 잡은 별도의 JVM에서 실행됨• 사용자가 개발한 맵/리듀스 함수의 어떤 버그도 태스크 트래커에 영향을 미치지 못함• 자식 프로세스와는 엄빌리컬 인터페이스를 통해 통신• 스트리밍과 파이프는 사용자가 제공한 실행 파일을 실행하고 통신하기 위해 특별한

맵 리듀스 태스크를 수행

13년 8월 31일 토요일

Page 11: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

태스크 실행(2/2)

PHVVDJH�RU�GHVFULSWLRQ��ZKLFK�PD\�EH�VHW�E\�XVHU�FRGH���7KHVH�VWDWXVHV�FKDQJH�RYHUWKH�FRXUVH�RI�WKH�MRE��VR�KRZ�GR�WKH\�JHW�FRPPXQLFDWHG�EDFN�WR�WKH�FOLHQW"

:KHQ�D�WDVN�LV�UXQQLQJ��LW�NHHSV�WUDFN�RI�LWV�SURJUHVV��WKDW�LV��WKH�SURSRUWLRQ�RI�WKH�WDVNFRPSOHWHG��)RU�PDS�WDVNV��WKLV�LV�WKH�SURSRUWLRQ�RI�WKH�LQSXW�WKDW�KDV�EHHQ�SURFHVVHG�)RU�UHGXFH�WDVNV��LW¦V�D�OLWWOH�PRUH�FRPSOH[��EXW�WKH�V\VWHP�FDQ�VWLOO�HVWLPDWH�WKH�SUR�SRUWLRQ�RI�WKH�UHGXFH�LQSXW�SURFHVVHG��,W�GRHV�WKLV�E\�GLYLGLQJ�WKH�WRWDO�SURJUHVV�LQWRWKUHH� SDUWV�� FRUUHVSRQGLQJ� WR� WKH� WKUHH� SKDVHV� RI� WKH� VKXIIOH� �VHH� £6KXIIOH� DQG6RUW¤�RQ�SDJH�������)RU�H[DPSOH��LI�WKH�WDVN�KDV�UXQ�WKH�UHGXFHU�RQ�KDOI�LWV�LQSXW��WKHQWKH�WDVN¦V�SURJUHVV�LV�൏��VLQFH�LW�KDV�FRPSOHWHG�WKH�FRS\�DQG�VRUW�SKDVHV��! HDFK��DQGLV�KDOIZD\�WKURXJK�WKH�UHGXFH�SKDVH��ൎ��

)LJXUH������7KH�UHODWLRQVKLS�RI�WKH�6WUHDPLQJ�DQG�3LSHV�H[HFXWDEOH�WR�WKH�WDVNWUDFNHU�DQG�LWV�FKLOG

Anatomy of a MapReduce Job Run | 171

13년 8월 31일 토요일

Page 12: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

진행 상황과 상태 갱신(1/2)

• 맵리듀스 잡은 대부분 상당한 시간이 걸리기 때문에 진행 상황에 대한 피드백을 얻는 것이 중요• 태스크 진행율

• 맵 태스크: 처리된 입력의 비율• 리듀스 태스크: 총 진행을 3단계로 나누어 계산(셔플 포함)

• 카운터를 통한 피드백• 태스크는 카운터를 가지고 있음.

• 프레임워크에 내장되거나 사용자가 정의한 카운터를 실행하는 방식으로 이벤트 카운트 가능

• 진행 상황의 통지• 태스크는 보고 플래그가 설정되어 있다면 태스크 트래커에게 진행 상황을 3초마다 보고• 태스크 트래커는 하트비트에 진행중인 모든 태스크의 상태를 포함하여 전송• 클라이언트 잡은 매초마다 잡 트래커를 폴링하여 최신 정보를 갱신

13년 8월 31일 토요일

Page 13: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

진행 상황과 상태 갱신(2/2)

7KH�MREWUDFNHU�DOVR�VHQGV�DQ�+773�MRE�QRWLILFDWLRQ�LI�LW�LV�FRQILJXUHG�WR�GR�VR��7KLVFDQ�EH� FRQILJXUHG�E\� FOLHQWV�ZLVKLQJ� WR� UHFHLYH� FDOOEDFNV�� YLD� WKH�job.end.notification.url�SURSHUW\�

/DVW��WKH�MREWUDFNHU�FOHDQV�XS�LWV�ZRUNLQJ�VWDWH�IRU�WKH�MRE�DQG�LQVWUXFWV�WDVNWUDFNHUV�WRGR�WKH�VDPH��VR�LQWHUPHGLDWH�RXWSXW�LV�GHOHWHG��IRU�H[DPSOH��

Failures,Q�WKH�UHDO�ZRUOG��XVHU�FRGH�LV�EXJJ\��SURFHVVHV�FUDVK��DQG�PDFKLQHV�IDLO��2QH�RI�WKHPDMRU�EHQHILWV�RI�XVLQJ�+DGRRS�LV�LWV�DELOLW\�WR�KDQGOH�VXFK�IDLOXUHV�DQG�DOORZ�\RXU�MREWR�FRPSOHWH�

Task Failure&RQVLGHU�ILUVW�WKH�FDVH�RI�WKH�FKLOG�WDVN�IDLOLQJ��7KH�PRVW�FRPPRQ�ZD\�WKDW�WKLV�KDSSHQVLV�ZKHQ�XVHU�FRGH�LQ�WKH�PDS�RU�UHGXFH�WDVN�WKURZV�D�UXQWLPH�H[FHSWLRQ��,I�WKLV�KDSSHQV�

)LJXUH������+RZ�VWDWXV�XSGDWHV�DUH�SURSDJDWHG�WKURXJK�WKH�0DS5HGXFH�V\VWHP

Failures | 173

13년 8월 31일 토요일

Page 14: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

잡 완료• 잡 트래커는 하나의 잡에 대한 마지막 태스크가 완료

되었을 경우 상태를 “성공”으로 변경

• 클라이언트는 상태를 검사하고, 사용자에게 알려주기 위한 메시지를 출력

• waitForcompletion 메소드가 종료되고, 잡 통계와 카운터가 콘솔로

출력됨

• 잡 트래커의 설정에 따라 HTTP 잡 통지 가능• 콜백을 받고자 하는 클라이언트는 job.end.notification.url을 설정

13년 8월 31일 토요일

Page 15: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Map Reduce IIYARN

(Yet Another Resource Negotiator)

13년 8월 31일 토요일

Page 16: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

이전 버전과의 차이 (1/2)• 이전 버전의 맵 리듀스 시스템은 4,000 노드 이상의 매우 큰 클러스터 상에서 동작시 병목현상 이슈가 발생함

• 확장성 문제를 해결하기 위해 잡트래커의 책임을 여러 컨포넌트로 분리

• 리소스 매니저: 리소스 이용을 관리• 애플리케이션 마스터: 클러스터에서 실행중인 애플리케이션의 생명 주기 관리• 노드매니저: 컨테이너를 감시하고, 응용 프로그램이 할당받은 그 이상의 리소스가

사용되지 않도록 보장

• 잡 트래커와 다르게 응용 프로그램의 각 인스턴스는 애플리케이션 마스터를 고정적으로 할당시켜 응용 프로그램의 지속성을 유지

13년 8월 31일 토요일

Page 17: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

이전 버전과의 차이 (2/2)

출처: Hortonworks, http://hortonworks.com/hadoop/yarn

13년 8월 31일 토요일

Page 18: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

주요 컨포넌트• 클라이언트

• 맵리듀스 잡을 제출

• 얀 리소스 매니저

• 클러스터 내 컴퓨팅 리소스 할당을 조정

• 얀 노드 매니저

• 클러스터 내 서버의 컴퓨팅 컨테이너를 배포 및 모니터

• 맵리듀스 애플리케이션 마스터

• 맵 리듀스 잡을 실행하고 있는 태스크를 조정

• 분산 파일 시스템

• 다른 시스템 컴포넌트 간 잡 파일을 공유하기 위해 사용

13년 8월 31일 토요일

Page 19: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

YARN Map-Reduce

duce.framework.name�LV�VHW�WR�yarn��7KH�VXEPLVVLRQ�SURFHVV�LV�YHU\�VLPLODU�WR�WKH�FODVVLFLPSOHPHQWDWLRQ��7KH�QHZ�MRE�,'�LV�UHWULHYHG�IURP�WKH�UHVRXUFH�PDQDJHU��UDWKHU�WKDQWKH�MREWUDFNHU���DOWKRXJK�LQ�WKH�QRPHQFODWXUH�RI�<$51�LW�LV�DQ�DSSOLFDWLRQ�,'��VWHS����7KH�MRE�FOLHQW�FKHFNV�WKH�RXWSXW�VSHFLILFDWLRQ�RI�WKH�MRE��FRPSXWHV�LQSXW�VSOLWV��DO�WKRXJK�WKHUH�LV�DQ�RSWLRQ�WR�JHQHUDWH�WKHP�RQ�WKH�FOXVWHU��yarn.app.mapreduce.am.compute-splits-in-cluster��ZKLFK�FDQ�EH�EHQHILFLDO�IRU�MREV�ZLWK�PDQ\�VSOLWV���DQG�FRSLHVMRE�UHVRXUFHV��LQFOXGLQJ�WKH�MRE�-$5��FRQILJXUDWLRQ��DQG�VSOLW�LQIRUPDWLRQ��WR�+')6�VWHS�����)LQDOO\��WKH�MRE�LV�VXEPLWWHG�E\�FDOOLQJ�submitApplication()�RQ�WKH�UHVRXUFHPDQDJHU��VWHS����

Job Initialization:KHQ�WKH�UHVRXUFH�PDQDJHU�UHFHLYHV�D�FDOO�WR�LWV�submitApplication()��LW�KDQGV�RII�WKHUHTXHVW�WR�WKH�VFKHGXOHU��7KH�VFKHGXOHU�DOORFDWHV�D�FRQWDLQHU��DQG�WKH�UHVRXUFH�PDQDJHUWKHQ�ODXQFKHV�WKH�DSSOLFDWLRQ�PDVWHU¦V�SURFHVV�WKHUH��XQGHU�WKH�QRGH�PDQDJHU¦V�PDQ�DJHPHQW��VWHSV��D�DQG��E��

7KH�DSSOLFDWLRQ�PDVWHU�IRU�0DS5HGXFH�MREV�LV�D�-DYD�DSSOLFDWLRQ�ZKRVH�PDLQ�FODVV�LVMRAppMaster��,W�LQLWLDOL]HV�WKH�MRE�E\�FUHDWLQJ�D�QXPEHU�RI�ERRNNHHSLQJ�REMHFWV�WR�NHHSWUDFN�RI�WKH�MRE¦V�SURJUHVV��DV�LW�ZLOO�UHFHLYH�SURJUHVV�DQG�FRPSOHWLRQ�UHSRUWV�IURP�WKHWDVNV��VWHS�����1H[W��LW�UHWULHYHV�WKH�LQSXW�VSOLWV�FRPSXWHG�LQ�WKH�FOLHQW�IURP�WKH�VKDUHGILOHV\VWHP��VWHS�����,W�WKHQ�FUHDWHV�D�PDS�WDVN�REMHFW�IRU�HDFK�VSOLW��DQG�D�QXPEHU�RIUHGXFH�WDVN�REMHFWV�GHWHUPLQHG�E\�WKH�mapreduce.job.reduces�SURSHUW\�

7KH�QH[W�WKLQJ�WKH�DSSOLFDWLRQ�PDVWHU�GRHV�LV�GHFLGH�KRZ�WR�UXQ�WKH�WDVNV�WKDW�PDNHXS�WKH�0DS5HGXFH�MRE��,I�WKH�MRE�LV�VPDOO��WKH�DSSOLFDWLRQ�PDVWHU�PD\�FKRRVH�WR�UXQWKHP�LQ�WKH�VDPH�-90�DV�LWVHOI��VLQFH�LW�MXGJHV�WKH�RYHUKHDG�RI�DOORFDWLQJ�QHZ�FRQWDLQHUVDQG�UXQQLQJ�WDVNV�LQ�WKHP�DV�RXWZHLJKLQJ�WKH�JDLQ�WR�EH�KDG�LQ�UXQQLQJ�WKHP�LQ�SDUDOOHO�FRPSDUHG�WR�UXQQLQJ�WKHP�VHTXHQWLDOO\�RQ�RQH�QRGH���7KLV�LV�GLIIHUHQW�WR�0DS5HGXFH���ZKHUH�VPDOO� MREV�DUH�QHYHU� UXQ�RQ�D� VLQJOH� WDVNWUDFNHU���6XFK�D� MRE� LV� VDLG� WR�EHXEHUL]HG��RU�UXQ�DV�DQ�XEHU�WDVN�

:KDW�TXDOLILHV�DV�D�VPDOO�MRE"�%\�GHIDXOW�RQH�WKDW�KDV�OHVV�WKDQ����PDSSHUV��RQO\�RQHUHGXFHU��DQG�WKH�LQSXW�VL]H�LV�OHVV�WKDQ�WKH�VL]H�RI�RQH�+')6�EORFN���7KHVH�YDOXHV�PD\

)LJXUH������+RZ�+DGRRS�UXQV�D�0DS5HGXFH�MRE�XVLQJ�<$51

Anatomy of a MapReduce Job Run | 197

www.it-ebooks.info

13년 8월 31일 토요일

Page 20: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

잡 제출

• 잡 제출 과정은 이전 버전과 유사

• 잡 제출 과정

• 사용자 API를 사용하여 잡 제출 실행

• 리소스 매니저로부터 새로운 애플리케이션 ID 를 할당 받음

• 클라이언트는 잡 리소스를 분산 파일 시스템으로 복사

• 리소스 매니저의 submitApplication을 호출하여 잡 제출을 완료

13년 8월 31일 토요일

Page 21: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

잡 초기화• 리소스 매니저는 submitApplication이 호출되면 스케쥴러로 요청을 전달

• 스케쥴러의 잡 할당 과정

• 컨테이너를 할당하고, 리소스 매니저는 노드 매니저의 관리를 받도록 애플리케이션 마스터를 할당 받은 컨테이너로 배포

• 애플리케이션 마스터는 잡의 진행 상황을 감시하기 위한 다수의 북키핑 객체를 생성하면서 잡을 초기화

• 태스크로 부터 잡의 진행상황과 완료를 통보 받음

• 공유 파일 시스템으로 부터 계산된 스플릿을 받음

• 애플리케이션 마스터는 mapreduce.job.reduces 속성으로 정해진 다수의 리듀스 객체와 맵 태스크 객체 생성하고 태스크 수행 방법을 결정

• 작은 잡일 경우 동일 JVM에서 태스크를 실행(유버 라이즈 or 유버 태스크)

• 애플리케이션 마스터는 모든 태스크를 실행 전에 출력 디렉토리를 생성하는 잡 설정 메소드를 호출

13년 8월 31일 토요일

Page 22: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

태스크 할당• 유버 태스크로 실행하기 적합하지 않은 잡일 경우 애플리케이션 마스터는 리소스 매니

저에게 컨테이너를 요청

• 모든 요청은 하트 비트 호출에 피기백 됨

• 맵 태스크의 데이터 지역성과 특별히 입력 스플릿이 위치한 호스트 및 해당 랙 정보 포함

• 태스크는 데이터 지역성을 고려하여 할당함

• 메모리 할당 방식

• 맵리듀스 1

• 클러스터 구성 시 설정된 고정 개수의 슬롯을 가짐

• 슬롯은 최대 메모리 허용치가 클러스터 단위로 고정되어 있음

• 적은 태스크가 주어질 경우 이용률이 떨어짐

• YARN

• 애플리케이션은 메모리의 최소 할당과 최대 할당에 대한 요청이 가능

• 기본적인 메모리 할당은 스케줄러에 지정되어 있음

13년 8월 31일 토요일

Page 23: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

태스크 실행• 태스크 실행 과정

• 애플리케이션 마스터는 노드 매니저에 협조를 얻어 컨테이너를 작동

• 태스크는 자바 애플리케이션으로 실행됨 YarnChild

• 애플리케이션은 태스크가 필요로 하는 리소스를 로컬로 가져옴

• 맵이나 리듀스 태스크 실행

• 맵 리듀스 1과 동일하게 YarnChild는 할당된 JVM에서 실행

• Yarn은 JVM 재사용을 지원하지 않음. 매번 생성

• 스트리밍과 파이프 프로그램은 맵리듀스 2과 동일하게 작동

13년 8월 31일 토요일

Page 24: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

진행 상황과 상태 갱신 (1/2)

• YARN에서는 진행상황과 상태 정보를 애플리케이션 마스터에게 보고

• 클라이언트는 진행 상황의 변화를 확인하기 위하여 매초마다 애플리케이션 마스터를 조회

• 진행 상황 모니터링

• 맵리듀스 I: 잡 트래커의 웹 UI를 통해 제공

• YARN: 리소스 매니저의 웹 UI를 통해 실행중인 모든 애플리케이션을 보여주고, 각 링크가 애플리케이션 마스터의 웹 UI로 연결 됨

13년 8월 31일 토요일

Page 25: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

진행 상황과 상태 갱신 (2/2)

�E���7KH�WDVN�LV�H[HFXWHG�E\�D�-DYD�DSSOLFDWLRQ�ZKRVH�PDLQ�FODVV�LV�YarnChild��%HIRUHLW�FDQ�UXQ�WKH�WDVN�LW�ORFDOL]HV�WKH�UHVRXUFHV�WKDW�WKH�WDVN�QHHGV��LQFOXGLQJ�WKH�MRE�FRQ�ILJXUDWLRQ�DQG�-$5�ILOH��DQG�DQ\�ILOHV�IURP�WKH�GLVWULEXWHG�FDFKH��VWHS������)LQDOO\��LWUXQV�WKH�PDS�RU�UHGXFH�WDVN��VWHS�����

7KH�YarnChild�UXQV�LQ�D�GHGLFDWHG�-90��IRU�WKH�VDPH�UHDVRQ�WKDW�WDVNWUDFNHUV�VSDZQQHZ�-90V�IRU�WDVNV�LQ�0DS5HGXFH����WR�LVRODWH�XVHU�FRGH�IURP�ORQJ�UXQQLQJ�V\VWHPGDHPRQV��8QOLNH�0DS5HGXFH����KRZHYHU��<$51�GRHV�QRW�VXSSRUW�-90�UHXVH�VR�HDFKWDVN�UXQV�LQ�D�QHZ�-90�

6WUHDPLQJ� DQG� 3LSHV� SURJUDPV�ZRUN� LQ� WKH� VDPH�ZD\� DV�0DS5HGXFH� ��� 7KH� YarnChild�ODXQFKHV�WKH�6WUHDPLQJ�RU�3LSHV�SURFHVV�DQG�FRPPXQLFDWHV�ZLWK�LW�XVLQJ�VWDQGDUGLQSXW�RXWSXW�RU�D�VRFNHW��UHVSHFWLYHO\���DV�VKRZQ�LQ�)LJXUH������H[FHSW�WKH�FKLOG�DQGVXESURFHVVHV�UXQ�RQ�QRGH�PDQDJHUV��QRW�WDVNWUDFNHUV��

Progress and Status Updates:KHQ�UXQQLQJ�XQGHU�<$51��WKH�WDVN�UHSRUWV�LWV�SURJUHVV�DQG�VWDWXV��LQFOXGLQJ�FRXQ�WHUV��EDFN�WR�LWV�DSSOLFDWLRQ�PDVWHU�HYHU\�WKUHH�VHFRQGV��RYHU�WKH�XPELOLFDO�LQWHUIDFH��ZKLFK�KDV�DQ�DJJUHJDWH�YLHZ�RI�WKH�MRE��7KH�SURFHVV�LV�LOOXVWUDWHG�LQ�)LJXUH������&RQWUDVWWKLV�WR�0DS5HGXFH����ZKHUH�SURJUHVV�XSGDWHV�IORZ�IURP�WKH�FKLOG�WKURXJK�WKH�WDVN�WUDFNHU�WR�WKH�MREWUDFNHU�IRU�DJJUHJDWLRQ�

7KH� FOLHQW� SROOV� WKH� DSSOLFDWLRQ�PDVWHU� HYHU\� VHFRQG� �VHW� YLD� mapreduce.client.progressmonitor.pollinterval��WR�UHFHLYH�SURJUHVV�XSGDWHV��ZKLFK�DUH�XVXDOO\�GLVSOD\HGWR�WKH�XVHU�

Job Completion$V�ZHOO�DV�SROOLQJ� WKH�DSSOLFDWLRQ�PDVWHU� IRU�SURJUHVV��HYHU\� ILYH�VHFRQGV� WKH�FOLHQWFKHFNV�ZKHWKHU�WKH�MRE�KDV�FRPSOHWHG�ZKHQ�XVLQJ�WKH�waitForCompletion()�PHWKRG�RQJob�� 7KH� SROOLQJ� LQWHUYDO� FDQ� EH� VHW� YLD� WKH� mapreduce.client.completion.pollinterval�FRQILJXUDWLRQ�SURSHUW\�

1RWLILFDWLRQ�RI�MRE�FRPSOHWLRQ�YLD�DQ�+773�FDOOEDFN�LV�DOVR�VXSSRUWHG�OLNH�LQ�0DS5H�GXFH����,Q�0DS5HGXFH���WKH�DSSOLFDWLRQ�PDVWHU�LQLWLDWHV�WKH�FDOOEDFN�

)LJXUH������+RZ�VWDWXV�XSGDWHV�DUH�SURSDJDWHG�WKURXJK�WKH�0DS5HGXFH���V\VWHP

Anatomy of a MapReduce Job Run | 199

www.it-ebooks.info

13년 8월 31일 토요일

Page 26: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

잡 완료• 잡이 완료되면 애플리케이션 마스터와 태스크 컨테이너는 작업 상태를 정리하고 OutputCommitter의 잡 청소 메소드를 호출

• 잡 정보는 사용자가 필요할 때 사후 조사를 위해 잡 히스토리 서버가 아카이빙

• 맵 리듀스 I에서처럼 HTTP 콜백을 통해 잡 실행 관련 이벤트 통지

13년 8월 31일 토요일

Page 27: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Failures

13년 8월 31일 토요일

Page 28: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Map Reduce I

13년 8월 31일 토요일

Page 29: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

태스크 실패• 실패 유형

• 대부분의 실패 유형은 맵 또는 리듀스 태스크 내의 사용자 코드 예외

• JVM 버그로 인한 실패

• 태스크 트래커가 일정기간 진행 상황을 갱신 받지 못할때

• 잡 트래커는 태스크의 실패를 통지 받으면 태스크 실행을 다시 스케쥴링

• 이전에 실패한 태스크 트래커에게 태스크 할당하지 않음

• 특정 태스크가 4번 이상 실패시 더 이상 실행 안함, 전체 잡을 실패로 간주(mapred.map.max.attempts, mapred.reduce.max.attempts)

• 실패 허용 비율을 설정하여 몇몇 태스크의 실패와 관련 없이 잡을 성공으로 처리 가능 (mapred.max.map.failures.precent, mapred.max.reduce.failures.precent)

• 강제로 종료된 태스크의 경우 실패로 간주하지 않음 (실패한 태스크 트래커 상에서 실행된 태스크)

13년 8월 31일 토요일

Page 30: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

태스크 트래커 실패• 잡 트래커로의 하트 비트 전송이 중단될 경우 실패로 간주

• 잡 트래커는 해당 태스크 트래커를 풀에서 제외

• 진행중인 태스크와 완료되지 못한 맵태스크를 조사하여 다른곳에서 재 실행

• 블랙 리스트 관리

• 동일 잡에서 4개 이상의 태스크가 특정 태스크 트래커에서 실패한다면 장애로 기록하고, 장애횟수가 최소 한계점을 넘을 경우 블랙리스트로 관리

• 블랙 리스트가 된 태스크 트래커는 태스크를 할당 받지 못함

• 장애에 대한 유효시간이 만료되면, 다시 태스크를 실행할 기회를 얻음

• 시스템 장애일 경우 클러스터에 다시 등록되고 재실행되어야 블랙리스트로 부터 제거 됨.

13년 8월 31일 토요일

Page 31: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

잡 트래커 실패• 가장 심각한 실패 유형

• 잡 트래커의 실패를 다룰 수 있는 매커니즘이 없음

• 모든 잡이 실패함

• 이러한 실패유형은 드물게 발생

• YARN의 설계 목적이 맵 리듀스의 단일점 실패 제거에 있음

13년 8월 31일 토요일

Page 32: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Map Reduce IIYARN

(Yet Another Resource Negotiator)

13년 8월 31일 토요일

Page 33: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

태스크 실패

• 맵 리듀스 1과 유사

• 애플리케이션 마스터로의 핑이 없을 경우 실패로 간주

13년 8월 31일 토요일

Page 34: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

애플리케이션 마스터 실패

• 애플리케이션 마스터가 실패할 경우 몇번의 재시도가 일어남.

• yarn.resourcemanager.am.maxretries

• 기본 값은 재실행하지 않음

• 애플리케이션 마스터가 실패하면 리소스 매니저가 새로운 컨테이너에서 실행할 새로운 인스턴스를 생성

• 클라이언트는 진행 상황 보고를 위해 마스터를 폴링

• 클라이언트는 마스터의 주소를 캐시하고 있는데, 마스터 실패시 리소스 매니저에게 새로운 마스터의 주소를 요청함

13년 8월 31일 토요일

Page 35: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

노드 매니저 실패• 리소스 매니저로의 하트 비트 전송이 없을때 실패로 간주

• 기본값 10분

• yarn.resourcemanager.nm.liveness-monitor.expiry-interval-ms

• 실패한 노드 매니저에서 실행 중인 태스크나 마스터는 각각의 복구 매카니즘을 따름

• 애플리케이션의 실패 횟수가 높으면 블랙 리스트로 관리됨

• 블랙 리스트는 애플리케이션 마스터가 관리

• 한 노드 매니저에서 3개 이상의 태스크가 실패하면 태스크를 다른 노드로 다시 스케쥴링

• mapreduce.job.maxtraskfailures.per.tracker

13년 8월 31일 토요일

Page 36: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

리소스 매니저 실패• 리소스 매니저의 실패는 심각

• 리소스 매니저 없이는 어떤 잡이나 태스크도 컨테이너에 배치되지 못함

• 리소스 매니저 시스템 충돌 문제 해결

• 체크 포인트 메카니즘을 사용하여 안정적인 스토리에 상태 정보를 저장하는 방식을 목표로 함

• 충돌후 관리자에 의해 재 실행되고 저장되었던 상태로 부터 복구됨

• 리소스 매니저가 사용하는 스토리지

• yarn.resouremanager.store.class로 설정

• 기본 값은 org.apache.hadoop.yarn.server.resource.manager.recovery.MemStore

• 현재 주키퍼 기반 저장소가 개발중에 있으며, 향후 리소스 매니저의 실패에 안정적인 복구 기능이 제공될 예정

13년 8월 31일 토요일

Page 37: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Job Scheduling

13년 8월 31일 토요일

Page 38: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

• FIFO 큐 기반의 스케쥴러

• 맵 리듀스의 기본적인 스케쥴링 방식

• 우선 순위를 부여하여 스케쥴링시 먼저 실행되는 것이 가능하나, 선점을 허용하지 않음

• 페어 스케쥴러

• 모든 사용자가 클러스터를 시간적으로 공평하게 공유할 수 있도록 하는 것이 목적

• 잡은 풀에 위치, 기본적으로 사용자는 자신만의 풀을 가짐

• 선점을 허용. 어떤 풀이 자원을 공평하게 공유 받지 못했다면, 많은 자원을 사용중인 풀의 태스크를 강제로 종료

• 커패시티 스케쥴러

• 클러스터는 다수의 큐로 구성되고, 각 큐는 할당된 수용량이 있음

• 큐의 잡을 FIFO 스케쥴링 하는 것을 제외하면 페어 스케쥴러와 유사

• 사용자나 조직이 맵 리듀스 클러스터를 개별적으로 사용하는 듯한 효과를 줌

13년 8월 31일 토요일

Page 39: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Shuffle and Sort

13년 8월 31일 토요일

Page 40: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

셔플

• 정렬을 수행하고 맵의 출력을 리듀서의 입력으로 전달하는 과정

• 맵 리듀스 프로그램을 최적화할때 중요한 튜닝 포인트

• 셔플은 코드 기반의 영역으로 현재 정재와 개선이 끊임없이 이루어 지고 있음

13년 8월 31일 토요일

Page 41: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

맵 과정• 맵 태스크는 환형 구조의 메모리 버퍼를 가지고 있으며, 이 메모리에 데이터를 기록

• 버퍼의 내용이 한계 크기에 도달하면, 백 그라운드 스레드는 디스크로 스필 시작

• 디스크 쓰기에 앞서 리듀스에 상응하는 파티션을 생성

• 각 파티션 내에서 인메모리에서 키에 따라 정렬을 수행

• 컴바이너 함수가 있을 경우 정렬된 출력을 바탕으로 컨바인 잡을 수행

• 메모리 버퍼가 스필 한계에 도달할때 마다 새로운 스필 파일이 생성되고, 태스크가 완료되기 전 스필파일을 하나로 병합

• 최소 3개의 스필 파일이 존재할 경우 출력 파일을 쓰기전 컨바인 잡을 수행

• 출력 파일의 파티션은 리듀서가 HTTP 프로토콜을 통해서 가져 갈수 있도록 만들어짐

5HGXFH� SURJUDP�� 7KH� VKXIIOH� LV� DQ� DUHD� RI� WKH� FRGHEDVH� ZKHUH� UHILQHPHQWV� DQGLPSURYHPHQWV� DUH� FRQWLQXDOO\�EHLQJ�PDGH�� VR� WKH� IROORZLQJ�GHVFULSWLRQ�QHFHVVDULO\FRQFHDOV�PDQ\�GHWDLOV��DQG�PD\�FKDQJH�RYHU�WLPH��WKLV�LV�IRU�YHUVLRQ��������,Q�PDQ\ZD\V��WKH�VKXIIOH�LV�WKH�KHDUW�RI�0DS5HGXFH�DQG�LV�ZKHUH�WKH�£PDJLF¤�KDSSHQV�

The Map Side:KHQ�WKH�PDS�IXQFWLRQ�VWDUWV�SURGXFLQJ�RXWSXW��LW�LV�QRW�VLPSO\�ZULWWHQ�WR�GLVN��7KHSURFHVV�LV�PRUH�LQYROYHG��DQG�WDNHV�DGYDQWDJH�RI�EXIIHULQJ�ZULWHV�LQ�PHPRU\�DQG�GRLQJVRPH�SUHVRUWLQJ�IRU�HIILFLHQF\�UHDVRQV��)LJXUH�����VKRZV�ZKDW�KDSSHQV�

(DFK�PDS�WDVN�KDV�D�FLUFXODU�PHPRU\�EXIIHU�WKDW�LW�ZULWHV�WKH�RXWSXW�WR��7KH�EXIIHU�LV����0%�E\�GHIDXOW��D�VL]H�ZKLFK�FDQ�EH�WXQHG�E\�FKDQJLQJ�WKH�io.sort.mb�SURSHUW\�:KHQ�WKH�FRQWHQWV�RI�WKH�EXIIHU�UHDFKHV�D�FHUWDLQ�WKUHVKROG�VL]H��io.sort.spill.percent��GHIDXOW�0.80��RU�������D�EDFNJURXQG�WKUHDG�ZLOO�VWDUW�WR�VSLOO�WKH�FRQWHQWV�WR�GLVN�0DS�RXWSXWV�ZLOO�FRQWLQXH�WR�EH�ZULWWHQ�WR�WKH�EXIIHU�ZKLOH�WKH�VSLOO�WDNHV�SODFH��EXW�LIWKH�EXIIHU�ILOOV�XS�GXULQJ�WKLV�WLPH��WKH�PDS�ZLOO�EORFN�XQWLO�WKH�VSLOO�LV�FRPSOHWH�

6SLOOV� DUH� ZULWWHQ� LQ� URXQG�URELQ� IDVKLRQ� WR� WKH� GLUHFWRULHV� VSHFLILHG� E\� WKHmapred.local.dir�SURSHUW\��LQ�D�MRE�VSHFLILF�VXEGLUHFWRU\�

)LJXUH������6KXIIOH�DQG�VRUW�LQ�0DS5HGXFH

%HIRUH�LW�ZULWHV�WR�GLVN��WKH�WKUHDG�ILUVW�GLYLGHV�WKH�GDWD�LQWR�SDUWLWLRQV�FRUUHVSRQGLQJWR�WKH�UHGXFHUV�WKDW�WKH\�ZLOO�XOWLPDWHO\�EH�VHQW�WR��:LWKLQ�HDFK�SDUWLWLRQ��WKH�EDFN�JURXQG�WKUHDG�SHUIRUPV�DQ�LQ�PHPRU\�VRUW�E\�NH\��DQG�LI�WKHUH�LV�D�FRPELQHU�IXQFWLRQ�LW�LV�UXQ�RQ�WKH�RXWSXW�RI�WKH�VRUW��5XQQLQJ�WKH�FRPELQHU�IXQFWLRQ�PDNHV�IRU�D�PRUH

�� 7KH�WHUP�VKXIIOH�LV�DFWXDOO\�LPSUHFLVH��VLQFH�LQ�VRPH�FRQWH[WV�LW�UHIHUV�WR�RQO\�WKH�SDUW�RI�WKH�SURFHVV�ZKHUHPDS�RXWSXWV�DUH�IHWFKHG�E\�UHGXFH�WDVNV��,Q�WKLV�VHFWLRQ��ZH�WDNH�LW�WR�PHDQ�WKH�ZKROH�SURFHVV�IURP�WKHSRLQW�ZKHUH�D�PDS�SURGXFHV�RXWSXW�WR�ZKHUH�D�UHGXFH�FRQVXPHV�LQSXW�

206 | Chapter 6:ಗHow MapReduce Works

www.it-ebooks.info

13년 8월 31일 토요일

Page 42: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

리듀스 관점• 리듀스 태스크는 클러스터 전반에 걸쳐 있는 여러개의 맵 태스크로 부터 파티션을 가져와야 함

• 맵 출력이 작을 경우 메모리 버퍼로 복사

• 메모리의 버퍼가 한계 크기에 도달하면 병합되어 디스크에 저장

• 컴바이너가 있다면 병합 과정에서 데이터 양을 감소 시키기 위해 실행됨

• 복사된 파일이 디스크에 축적되면 이를 더 크고 정렬된 파일로 변합

• 모든 맵 출력이 복사되면 병합 과정을 수행

• 리듀스 함수는 정렬된 출력 내 각각의 키에 대해서 호출이 되고 이 단계의 출력을 분산 파일 시스템에 곧 바로 기록됨

• 태스크 트래커가 데이터 노드와 같은 곳에서 실행이 되기 때문에, 블록의 첫번째 복제본은 로컬에 저장됨

13년 8월 31일 토요일

Page 43: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

설정 조정• 맵 리듀스 성능을 향상 시킬려면 셔플을 튜닝할 줄 알아야 함

• 일반적인 원칙은 셔플에 가능한 한 많은 메모리를 할당하는 것

• 맵과 리듀스 함수가 동작하는 데 있어서 충반한 메모리를 확보하도록 보장해 주어야 함

• 맵과 리듀스 함수 작성 시 가능하면 메모리를 적게 사용하도록 작성

• 맵 측면에서 보면 적은 수의 파일이 디스크로 스필 될때 가장 좋은 성능을 발휘

• 맵 출력의 크기를 측정할 수 있다면, io.sort.* 속성을 적절히 설정하여 스필 파일의 수를 최소화 할 수 있음

• 리듀스 측면에서는 중간 데이터 전체가 메모리에 있을 때 가장 좋은 성능을 발휘

• 리듀스 함수가 모든 메모리를 예약해 두기 때문에 이러한 현상은 발생하지 않음

• 리듀스 함수가 메모리를 조금만 필요한다면, apred.inmem.merge.threshold를 0으로 mapred.job.reduce.input.buffer.percent를 1.0으로 설정하여 성능향상을 도모할 수 있음

13년 8월 31일 토요일

Page 44: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

Task Execution

13년 8월 31일 토요일

Page 45: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

투기적 실행• 맵 리듀스 모델은 잡을 태스크로 나누고 병렬적으로 수행하는 것

• 잡 실행을 느리게 만드는 태스크에 대한 고민이 필요

• 투기적 실행

• 예상했던 것보다 태스크 수행이 느릴 경우를 감지하여 다른 동일한 예비 태스크를 실행

• 하둡은 낭비를 막기 위하여 해당 잡에 대한 모든 태스크가 실행되고 난 후에 실행

• 일정 시간이 경과 되었지만, 다른 태스크의 평균 진행 속도보다 느린 태스크만 대상으로 함

• 태스크가 성공적으로 완료되면 수행 중인 모든 복제 태스크는 강제 종료 됨

• 기본적으로 활성화 되어 있으나, 클러스터의 효율성 측면에서 비용이 따름

• 리듀스 태스트에 대한 투기적 실행

• 일반적으로 사용 안하는 것이 좋음

• 리듀스 태스크를 중복으로 실행하는 것은 맵 출력을 가져와야 하고, 클러스터에 걸쳐 전반적인 네트워크 트래픽을 증가 시킴

13년 8월 31일 토요일

Page 46: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

출력 커미터• 하둡 맵 리듀스는 잡과 태스크가 완전히 성공하거나 실패하는 것을 보장하기 위해 커밋 프로토콜을 사용

• 기본 값은 FileOutputCommitter이고, 사용자 맞춤형으로 변경 가능

Output Committers+DGRRS�0DS5HGXFH�XVHV�D�FRPPLW�SURWRFRO�WR�HQVXUH�WKDW�MREV�DQG�WDVNV�HLWKHU�VXF�FHHG��RU�IDLO�FOHDQO\��7KH�EHKDYLRU�LV�LPSOHPHQWHG�E\�WKH�OutputCommitter�LQ�XVH�IRU�WKHMRE��DQG�WKLV�LV�VHW�LQ�WKH�ROG�0DS5HGXFH�$3,�E\�FDOOLQJ�WKH�setOutputCommitter()�RQJobConf��RU�E\�VHWWLQJ�mapred.output.committer.class�LQ�WKH�FRQILJXUDWLRQ��,Q�WKH�QHZ0DS5HGXFH�$3,��WKH�OutputCommitter�LV�GHWHUPLQHG�E\�WKH�OutputFormat��YLD�LWV�getOutputCommitter()�PHWKRG��7KH�GHIDXOW�LV�FileOutputCommitter��ZKLFK�LV�DSSURSULDWH�IRUILOH�EDVHG�0DS5HGXFH��<RX�FDQ�FXVWRPL]H�DQ�H[LVWLQJ�OutputCommitter�RU�HYHQ�ZULWH�DQHZ�LPSOHPHQWDWLRQ�LI�\RX�QHHG�WR�GR�VSHFLDO�VHWXS�RU�FOHDQXS�IRU�MREV�RU�WDVNV�

7KH�OutputCommitter�$3,�LV�DV�IROORZV��LQ�ERWK�ROG�DQG�QHZ�0DS5HGXFH�$3,V��

public abstract class OutputCommitter {

public abstract void setupJob(JobContext jobContext) throws IOException; public void commitJob(JobContext jobContext) throws IOException { } public void abortJob(JobContext jobContext, JobStatus.State state) throws IOException { }

public abstract void setupTask(TaskAttemptContext taskContext) throws IOException; public abstract boolean needsTaskCommit(TaskAttemptContext taskContext) throws IOException; public abstract void commitTask(TaskAttemptContext taskContext) throws IOException; public abstract void abortTask(TaskAttemptContext taskContext) throws IOException;

}}

7KH�setupJob()�PHWKRG�LV�FDOOHG�EHIRUH�WKH�MRE�LV�UXQ��DQG�LV�W\SLFDOO\�XVHG�WR�SHUIRUPLQLWLDOL]DWLRQ��)RU�FileOutputCommitter�WKH�PHWKRG�FUHDWHV�WKH�ILQDO�RXWSXW�GLUHFWRU\�${mapred.output.dir}��DQG�D�WHPSRUDU\�ZRUNLQJ�VSDFH�IRU�WDVN�RXWSXW��${mapred.output.dir}/_temporary�

,I�WKH�MRE�VXFFHHGV�WKHQ�WKH�commitJob()�PHWKRG�LV�FDOOHG��ZKLFK�LQ�WKH�GHIDXOW�ILOH�EDVHG� LPSOHPHQWDWLRQ� GHOHWHV� WKH� WHPSRUDU\� ZRUNLQJ� VSDFH�� DQG� FUHDWHV� D� KLGGHQHPSW\�PDUNHU�ILOH�LQ�WKH�RXWSXW�GLUHFWRU\�FDOOHG�B68&&(66�WR�LQGLFDWH�WR�ILOHV\VWHPFOLHQWV�WKDW�WKH�MRE�FRPSOHWHG�VXFFHVVIXOO\��,I�WKH�MRE�GLG�QRW�VXFFHHG��WKHQ�WKH�abortJob()�LV�FDOOHG�ZLWK�D�VWDWH�REMHFW�LQGLFDWLQJ�ZKHWKHU�WKH�MRE�IDLOHG�RU�ZDV�NLOOHG��E\�DXVHU��IRU�H[DPSOH���,Q�WKH�GHIDXOW�LPSOHPHQWDWLRQ�WKLV�ZLOO�GHOHWH�WKH�MRE¦V�WHPSRUDU\ZRUNLQJ�VSDFH�

7KH�RSHUDWLRQV�DUH�VLPLODU�DW�WKH�WDVN�OHYHO��7KH�setupTask()�PHWKRG�LV�FDOOHG�EHIRUHWKH�WDVN�LV�UXQ��DQG�WKH�GHIDXOW�LPSOHPHQWDWLRQ�GRHVQ¦W�GR�DQ\WKLQJ��VLQFH�WHPSRUDU\GLUHFWRULHV�QDPHG�IRU�WDVN�RXWSXWV�DUH�FUHDWHG�ZKHQ�WKH�WDVN�RXWSXWV�DUH�ZULWWHQ�

7KH�FRPPLW�SKDVH�IRU�WDVNV�LV�RSWLRQDO��DQG�PD\�EH�GLVDEOHG�E\�UHWXUQLQJ�false�IURPneedsTaskCommit()��7KLV�VDYHV�WKH�IUDPHZRUN�IURP�KDYLQJ�WR�UXQ�WKH�GLVWULEXWHG�FRP�

Task Execution | 215

www.it-ebooks.info

13년 8월 31일 토요일

Page 47: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

태스크 JVM 재사용• 하둡은 다른 실행중인 태스크와 분리되도록 자신의

JVM에서 태스크를 수행

• 각 태스크에 대해 새로운 JVM을 시작시키는 오버헤드는 약 1초

• 매우 짧은 시간 수행하는 태스크일 경우 JVM을 재 사용하는 것이 성능상의 이득

• 태스크 JVM을 재사용하도록 설정하면 태스크는 하나의 JVM에서 순차적으로 수행됨• mapred.job.reuse.jvm.num.tasks

• YARN에서는 JVM 재사용 기능은 제공되지 않음

13년 8월 31일 토요일

Page 48: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

비정상 레코드 생략하기• 에러가 있는 레코드를 다루는 가장 좋은 방법은 매퍼와 리듀서 코드안

• 무시하거나, 예외를 발생 시켜 해당 잡을 취소

• 매퍼나 리듀서를 수정할 수 없는 3rd 파티 라이브러인 경우

• 하둡은 생략 모드를 지원, 기본적으로 OFF 상태

• 생략 모드의 동작I) 태스크 실패

II) 태스크 실패

III) 생략 모드가 활성화 됨. 태스크는 실패했지만 실패한 레코드는 태스크 트래커에 저장됨

IV) 생략 모드가 여전히 활성화 됨. 테스크가 이전 시행에서 실패했던 레코드를 생략

• 하둡에 의해 탐지된 비정상 레코드는 잡 출력 디렉토리의 _log/skip에 저장됨

• 생략 모드는 새로운 맵 리듀스 API에서는 제공되지 않음

13년 8월 31일 토요일

Page 49: 하둡완벽가이드 Ch6. 맵리듀스 작동 방법

References1. Tom White (2013). 하둡 완벽가이드. (심탁길, 김현우, 옮김). 서울: 한빛미디어. (원서출판 2012)

2. Hadoop YARN “A next-generation framework for Hadoop data processing”, Hortonworks, http://hortonworks.com/hadoop/yarn

13년 8월 31일 토요일