SITE MAP
데이터 통합 및 관리

IBM DataStage

IBM DataStage
제품 문의
데이터를 이동하고 변환하는 작업을 설계, 개발, 실행할 수 있도록
지원하는 업계 최고의 데이터 통합 솔루션

편리한 GUI 기반 설계, 뛰어난 확장성 및 연결성을 기반으로 대용량 데이터를 신속하게 처리할 수 있는 솔루션입니다.
데이터를 쉽게 이해하고, 정리하며, 모니터링하고 변환할 수 있도록 지원하는 선도적인 데이터 통합 플랫폼으로, 유연한 확장성과 대량 병렬 처리(MPP) 기능을 제공합니다.
또한 코딩 없이도 사용 가능한 직관적인 GUI를 제공하며, 다양한 형태의 데이터를 클라우드 환경에서도 신속하고 편리하게 통합할 수 있는 강력한 엔진을 갖추고 있습니다.

IBM DataStage
DataStage의 아키텍처

IBM InfoSphere DataStage는 IBM Information Server 아키텍처를 기반으로 운영되며, 공통 서비스와 다양한 Connectivity, 통합 메타데이터를 지원합니다.
개발 중 등록된 테이블 메타 정보, 개발된 프로그램 정보, 그리고 운영 중 발생하는 각종 정보는 중앙 저장소(Repository)에 저장되어 다중 사용자 환경을 지원합니다.

IBM DataStage
DataStage의 특장점
이기종 데이터 통합을 위한 유연한 ETL 솔루션

Infosphere DataStage는 다양한 형태의 소스와 타겟을 지원하며, 단일 Job에서 이기종 소스와 타겟을 동시에 액세스하여 데이터를 추출, 통합, 가공, 적재할 수 있는 ETL 솔루션입니다. 기본적으로 Any Source, Any Target을 지원하므로 다양한 환경에서 유연하게 사용할 수 있습니다.

  • 개발 생산성 (개발 공수 절감)
    GUI 기반의 Top-Down방식의 개발 환경
    직관적인 추출/변환/적재 설계
    다양한 변환 기능 제공
    ODBC Driver 제공 (Oracle, DB2, MySQL, MSSQL,..)
    Enterprise Application과 연동하기 위한 PACK
  • 성능 및 확장성 (대용량 데이터의 신속한 전송)
    고속 데이터 처리 엔진 기반
    대용량 데이터 전송 지원
    시스템 자원의 효율적 활용
    유연한 확장성
  • 운영 효율성 (운영 자동화)
    스케줄링 기능
    일괄처리 설계 및 작업결과 메일 통보
    실시간 모니터링 및 성능분석 화면 제공
    CDC (Changed Data Capture) 솔루션 연계
  • 관리 편의성 (관리 자원 절감)
    웹기반의 관리 환경
    메타데이터 재활용 기능
    보안관리 (사용자 권한 및 역할)
IBM DataStage
DataStage 도입 효과
구분 기존 개발 방식 IBM DataStage 적용 방식
생산성 각 플랫폼과 데이터 포맷에 맞춰 개발 및 디버깅에 많은 인력과 시간이 소요되며, 테스트와 결과 검증에도 많은 노력이 필요함 통합된 GUI 환경에서 Top Down 방식으로 손쉽게 이행 로직을 구현할 수 있으며, 자동 디버깅 기능을 통해 개발 시간과 인력을 절반 이상 단축할 수 있음
프로젝트
관리
여러 개발자가 다른 환경에서 프로젝트를 진행하므로 체계적 관리와 표준화가 어렵고, 진척도 파악이 복잡함 통합된 환경에서 Project 및 Job 단위로 작업을 관리하며, 메타데이터 공유와 품질 관리로 표준화와 진척도 관리를 쉽게 수행할 수 있음
데이터 품질
개선
모니터링을 통한 소스 데이터 검증 체계가 부족해, 최초 로직으로 구현된 검증 기준 외에 지속적인 기능 향상이 어려움 소스 데이터 오류를 유형별로 분류하고 체계적으로 관리해 근본적인 오류 원인을 제거하며, 지속적인 데이터 품질 개선 가능
데이터 오류
대응
일괄 처리 방식으로 데이터 갱신 중 발생한 오류에 대해 즉각적으로 대처하기 어려움 데이터 오류 발생 시 실행을 중단하고 오류를 수정한 후 재실행할 수 있어, 오류에 대한 즉각적인 대처가 가능함
데이터 이행
요건 변경
소스 데이터나 타겟 DB의 요건 변경 시 관련 프로그램을 수작업으로 수정해야 하며, 변경 대상 파악이 어렵고 시간이 많이 소요됨 메타DB를 통해 변경 대상을 정확히 파악하고 데이터 매핑 규칙을 수정하여 이행 프로그램을 자동으로 재생성할 수 있음
데이터 이행
모니터링
타겟 DB 갱신 정확성을 주기적으로 수동 확인해야 하며, 불일치 발생 시 원인 파악이 어려움 솔루션의 모니터링 기능을 통해 작업 성공/실패 여부와 처리 건수를 쉽게 모니터링하고, 수행 로그를 통해 불일치 원인을 신속하게 파악할 수 있음