Data Lineage

업무 분석을 위한 정보성의 데이터를 생성과정에서 데이터가 변환되어지는 흐름정보의 테이블/컬럼 간의 관계를 맵을 통해서 관리하는 데이터 흐름관리 솔루션입니다.
작업의 스케쥴 정보, 소스 데이터의 레이아웃 정보, 데이터의 매핑정보, 기타 프로그램 정보를 종합적으로 분석하여 데이터의 흐름정보로 나타냅니다.

Data Lineage 문제점
업무 데이터에서 분석하려는 데이터가 폭발적으로 증가함에 따라 데이터의 여러가지 유형의 오류가 증가 되고 있습니다. 데이터 이동경로를 쉽게 파악하고 대상 데이터의 변환전의 상태를 신속하게 확인 가능한 분석 툴입니다.
대표적으로 ETL업무, shell, DB Procedure등의 업무를 분석 할 수 있습니다.

    • 데이터의 확인 및 통합/수정 등에 많은 노력과 비용, 시간이 소모되고 있습니다.
    • 데이터의 오류는 직/간접적으로 비용과 직결 될 뿐만 아니라 기업의 신용 및 기회 손실로 이어 집니다.
    • 부적절한 데이터의 가공/변환은 잘못된 데이터의 생성 및 시스템 자원의 낭비가 됩니다.

 

서비스 목표

  • 데이터의 효율적/합리적 라이프 사이클 관리
  • 전사 데이터에 대한 현황 파악 및 최적화된 데이터의 관리

 

데이터흐름관리는 ETL Analyze, Data Lineage, Data Visualization으로 구성됩니다.

다이어그램_1
System Architecture
다이어그램_5
Case Study
K은행 데이터 흐름관리 프로젝트
D은행 정보계 고도화 프로젝트
ETL 흐름과 연관 테이블 흐름조회
noname01-1

ETL 흐름과 연관 테이블 흐름조회

noname01-2

방사형 테이블 흐름 조회

noname01-3

특정테이블 기준 시스템간 테이블 흐름조회