Hadoop을 이용한 분산 데이터 처리, Part 3: 애플리케이션 개발
Hadoop용 Ruby MapReduce 애플리케이션 개발하기
요약: 단일 및 다중 노드 아키텍처에서 Hadoop을 구성, 설치 및 사용하는 방법에 대해 살펴보았으므로 이제 Hadoop 인프라 내에서 애플리케이션을 개발하는 작업을 살펴볼 차례입니다. 시리즈의 마지막 기사인 이 기사에서는 Hadoop API와 데이터 플로우를 살펴본 후 이러한 API와 데이터 플로우를 간단한 맵퍼 및 축소자 애플리케이션에서 사용하는 방법을 보여 줍니다.
Tags for this article: 데이터베이스_및_데이터_관리, 리눅스
원문 게재일: 2010 년 7 월 14 일
번역 게재일: 2010 년 10 월 19 일
난이도: 중급
영어로: 보기
PDF: A4 and Letter (104KB | 13 pages)Get Adobe® Reader®
페이지뷰: 307 회
---------------------------------------------------------------------------------------------------------------
이 시리즈의 처음 두 기사에서는 주로 단일 및 다중 노드 클러스터를 위해 Hadoop을 설치 및 구성하는 방법에 대해 설명했다.
이 마지막 기사에서는 Hadoop 프로그래밍을 살펴보며 특히, Ruby 언어 내에서 맵핑 및 축소 애플리케이션을 개발하는 과정을
설명한다. 이 기사에서 Ruby를 선택한 첫 번째 이유는 개발자가 알고 있어야 하는 매우 뛰어난 오브젝트 지향 스크립트 언어
이기 때문이며, 두 번째 이유는 Java™ 및 Python 언어를 다루는 튜토리얼의 참고자료 섹션에서 수많은 참고자료를 볼 수 있
기 때문이다.
이 기사에서도 MapReduce 프로그래밍을 통해 streaming API(Application Programming Interface)를 소개한다.
이 API는 Java 이외의 언어로 애플리케이션을 개발할 수 있는 방법을 제공한다.
먼저 기능 관점에서 맵핑과 축소를 간단하게 살펴본 후 Hadoop 프로그래밍 모델 및 아키텍처 그리고 작업을 작성, 분배 및 관
리하는 요소에 대해 자세히 살펴보자.
원문 링크 : http://www.ibm.com/developerworks/kr/library/l-hadoop-3/index.html
'로그[log]' 카테고리의 다른 글
트위터 입문하는 분들을 위해... (0) | 2010.12.16 |
---|---|
[IBM developerWorks] 최적의 클라우드 컴퓨팅 플랫폼 찾기 (0) | 2010.11.18 |
[IBM developerWorks] 특집기사: 산업 포커스: 에너지와 유틸리티 (0) | 2010.11.15 |
[IBM developerWorks] Java 성능 모니터링에 대해 모르고 있던 5가지 사항, Part 2 (0) | 2010.10.26 |
[IBM developerWorks] IBM Information Management 입문 (한글) (0) | 2010.10.21 |
최근댓글