기관회원 [로그인]
소속기관에서 받은 아이디, 비밀번호를 입력해 주세요.
개인회원 [로그인]

비회원 구매시 입력하신 핸드폰번호를 입력해 주세요.
본인 인증 후 구매내역을 확인하실 수 있습니다.

회원가입
서지반출
하둡 기반 천문 응용 분야 대규모 데이터 분석 기법
[STEP1]서지반출 형식 선택
파일형식
@
서지도구
SNS
기타
[STEP2]서지반출 정보 선택
  • 제목
  • URL
돌아가기
확인
취소
  • 하둡 기반 천문 응용 분야 대규모 데이터 분석 기법
저자명
곽재혁,윤준원,정용환,함재균,박동인,Kwak. Jae-Hyuck,Yoon. Jun-Weon,Jung. Yong-Hwan,Hahm. Jae-Gyoon,Park. Dong-In
간행물명
정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터
권/호정보
2011년|17권 11호|pp.587-591 (5 pages)
발행정보
한국정보과학회
파일정보
정기간행물|
PDF텍스트
주제분야
기타
이 논문은 한국과학기술정보연구원과 논문 연계를 통해 무료로 제공되는 원문입니다.
서지반출

기타언어초록

과학 응용 분야에서 데이터 집약형 컴퓨팅(data-intensive computing)이 점차적으로 주목받으면서 대규모의 데이터를 빠른 시간 내에 효율적으로 처리해야 할 필요성으로 인해 클라우드 컴퓨팅이 주목받고 있다. 하둡(Hadoop)은 대규모 데이터 처리 분석을 위한 소프트웨어 프레임워크를 제공하며 클라우드 컴퓨팅의 대표적인 기술로서 널리 사용되고 있다. 특히, 하둡은 높은 확장성과 성능을 제공하면서 결함 탐지와 자동 복구 기능이 우수하여 과학 기술 분야에서도 점차적으로 도입되어 활용되고 있다. 본 논문에서는 하둡을 이용하여 천문 응용 분야에서 생성되는 대규모 데이터를 분석하기 위한 방법을 제안하였다. 본 논문에서 관심을 가지는 천문 응용 데이터는 SuperWASP프로젝트에서 생성되는 대략 천만 개의 작은 크기의 관측 데이터를 처리해야 하는데 하둡은 대규모 데이터 처리에 특화되어 있어서 많은 개수의 작은 크기를 가지는 관측 데이터 처리에는 적합하지 않다. 본 논문에서는 천문 응용 데이터 처리를 위한 입출력 파일을 하둡에서 제공하는 특수화된 데이터 구조를 이용하여 압축하였고 천문 응용 실행 코드가 하둡에서 실행 가능하도록 맵리듀스 작업으로 랩핑하여 구현하였다.

기타언어초록

Data-intensive computing being highly regarded in science application area, cloud computing has engaged public attention due to the necessity of efficiently processing large-scale data as soon as possible. Hadoop provides software framework for large-scale data processing and analysis, and is widely adopted and used as the representative technology of cloud computing. Especially, roviding high-scalability and performance and getting an excellence in fault-tolerence and automatic recovery functionalities, Hadoop is gradually used in scientific communities. In this paper, we propose a Hadoop-based method to analyse large-scale data generated from astroinformatics research area. astroinformatics data we are dealing with are generated from Super WASP project, which need to process about ten million of small-sized observation data. However, Hadoop is specialized in large-scale data analysis and it is not suitable for many small-sized astroinformatics data. In this paper, we packed many small-sized astroinformatics data into large-sized ones using the specialized data structure of Hadoop and implemented MapReduce wrapper program to execute astroinformatics analysis code on Hadoop.