Skip to content

데이터 품질진단 기법-2 #

Find similar titles
  • 최초 작성자
    sjkim

Structured data

Category
Management

업무규칙 #

업무규칙은 데이터 관리문서에 명시된 규칙, 업무담당자가 알고 있는 규칙, 코딩된 규칙 등으로 분산 관리되고 있는 규칙을 통합하여 데이터 품질을 지속해서 관리하기 위해 활용되는 규칙이다. 업무규칙은 업무 전문가와 품질 분석가들이 업무분석과 관리문서의 검토 등의 작업을 통하여 별도로 도출한다.

업무규칙 도출 절차 및 업무규칙 정의서 작성 #

Image

업무규칙 도출 절차 (출처)

데이터 현상 분석은 정보시스템 내부이용자와 외부 고객의 이슈로부터 품질을 파악하는 접근방식과 데이터를 분석하여 오류와 문제를 파악하는 방식으로 구분된다. 사전 파악된 데이터 품질 이슈와 프로파일링 결과를 토대로 업무규칙을 도출하여 주요 관리 대상으로 선정한다. 효율성을 높이기 위하여 규칙 도출 대상 항목을 선정한 후 이를 토대로 업무규칙 정의서를 작성하여 문서화 한다.

Image

업무규칙 도출 사례 (출처)

업무규칙 도출 대상 선정 #

업무규칙 도출 대상은 다음과 같이 선정할 수 있다.

Image

업무규칙 도출 대상 컬럼 목록 예시 (출처)

  • 데이터 관리 문서· 테이블 및 컬럼 정의서 등 사전에 작성된 자료를 토대로 업무규칙 도출 대상 목록을 작성한다.
  • 데이터 프로파일링 결과 오류가 발생한 대상 위주로 업무규칙 도출 대상을 선정한다.
    • 테이블 활용도 및 중요도 순으로 수행한다. 예) 공통업무 -> 고객관리 ...
    • 테이블의 작업 순서는 코드 테이블 -> 마스터 테이블 ... 순으로 계층적으로 수행한다.
    • 같은 업무 항목간 표준코드 테이블· 표준도메인· 도메인별 유효범위 등을 사전에 정의하여 같은 항목의 유효성 판단 시 활용하도록 한다.
    • 업무규칙 도출 대상 항목의 순서는 단일 항목에서 복수 항목 및 테이블로 확장한다.
  • 업무규칙을 적용할 데이터 항목별 측정 기준· 핵심 데이터 여부 등을 결정한다.
    • 항목별 측정 품질기준을 선정한다.
    • 해당 데이터 항목에도 도출 가능한 모든 유형의 업무규칙을 도출해야 한다.
  • 누락 또는 중복 항목이 있는지 검토한다.

업무규칙 정의서 작성 #

Image

업무규칙 정의서 작성 사례 (출처)

도출된 업무규칙을 토대로 업무규칙 정의서를 작성한다.

  • 관련 업무에 대한 구분이나 업무명 등을 기재한다.
  • 업무규칙은 테이블 컬럼 단위로 작성한다.
  • 다수의 테이블 및 컬럼과 관련 있는 업무규칙의 경우 데이터 측정 대상과 관련된 컬럼을 선정한다.
  • 업무규칙은 반드시 해당 품질 기준을 명시한다.
  • 업무규칙의 중요도는 업무규칙이 해당 업무와 서비스에 미치는 영향, 품질 기준의 중요도 등을 각 비중에 맞게 배분하여 계산한다.
  • 측정 SQL은 운영 DBMS 문법에 맞게 작성하여 기재한다.

업무규칙 조정 및 확정 #

업무규칙 정의서 작성 후 업무전문가,품질 분석가 등이 같이 검토 후 업무규칙 정의서를 수정· 보완한다.

  • 중요 업무규칙의 누락이 없는지 확인한다.
  • 업무규칙 중복을 확인한다.
  • 유사 성격의 항목이 전혀 다르게 업무규칙으로 작성된 경우가 있는지 확인한다.
  • 업무규칙 표현이 업무규칙 작성 표준과 일치하고 일관된 표현을 사용하는지 파악한다.

업무규칙 및 BR-SQL 사례 #

Image

날짜 선순위 관계 예시 (출처)

  • 날짜 및 시간의 선순위 관계
    • 날짜를 표현하는 값의 업무 시작 종료일의 관계가 역행되어 있거나 누락 된 업무규칙 위반사항 예시이다.

Image

물리 모델링 시 서브타입 설계 반영 예시 (출처)

  • 물리 모델링 시 서브타입 설계 반영

    • 그림에서의 예시에서 직원 구분에 따라 직언 코드, 일등 등의 값이 없어야 하나 값이 있는 오류데이터가 존재하는 예시이다.
  • 유도된 컬럼 속성값

    • 하나 이상의 컬럼으로부터 값이 파생 또는 새롭게 도출된 속성값을 말한다. 예를 들어 연령 - 현재년도 - 출생년도 / 재학기간 - 현재일 - 입학일 을 예로 들 수 있다.

Image

복수컬럼의 유일성 위반 예시 (출처)

  • 복수컬럼의 유일성
    • 복수 컬럼의 조합으로 유일한 값을 가져야 하는 경우이지만 위의 사진에서는 교육과정코드, 강사코드, 교육장소 조합의 값이 중복된 데이터가 존재하고 있는 예시이다.

Image)

계산 및 집계 관계 위반 예시 (출처)

  • 계산 및 집계 관계
    • 위 사진 예시에서의 월간 통계테이블의 수입액은 해당 년월에 해당하는 거래 완료된 주문의 총금액의 합과 동일하지 않은 예시이다.
0.0.1_20240318_1_v95