반응형
Mapper
- key와 value로 구성된 입력 데이터를 전달받아 데이터를 가공하고 분류해 새로운 데이터 목록을 생성
- Map Task 결과는 보통 Reducer의 입력으로 전달됨
Reducer
- Map Task의 출력 데이터를 입력 데이터로 전달받아 집계 연산을 수행
Combiner
- Mapper의 출력 데이터를 입력 데이터로 전달받아 연산을 수행하여 Shuffle할 데이터의 크기를 줄일 경우 사용
Partitioner
- Map Task의 출력 데이터가 어떤 Reduce Task로 전달될지를 결정
Shuffle
- Map Task와 Reduce Task 사이의 데이터 전달 과정
Hive
- 데이터 분석 로직을 SQL 형태로 수행할 수 있도록 해주는 것
반응형
'Development > Hadoop' 카테고리의 다른 글
[Hadoop] 카운터 사용하기 (0) | 2018.10.13 |
---|---|
[Hadoop] 예제 (0) | 2018.09.02 |
[Hadoop] 이슈 (0) | 2018.09.01 |
[Hadoop] 명령어 (0) | 2018.09.01 |
[Hadoop] 설치하기 (0) | 2018.08.04 |