Skip to content

데이터 품질진단 절차2 #
Find similar titles

Structured data

Category
Management

데이터 품질 측정 #

데이터 품질 측정 단계는 도출된 업무규칙을 진단대상 데이터에 적용하고 오류데이터를 추출하고 그 현황을 파악하는 오류데이터 검증 단계와 그 결과를 요약하는 품질 현황을 보고하는 단계로 구성된다.

  • 품질 측정 계획 수립
    • 사전에 수립한 품질 측정 세부 시행 계획에 따른 실행계획으로, 구체적인 시간 계획과 책임 할당, 사전 준비 등의 실행을 계획.
  • 품질측정 체크리스트 준비
    • 정형·비정형 데이터 유형에 따라 도출된 업무규칙과 측정항목을 토대로 품질 측정에 사용할 체크리스트 작성.
  • 데이터 품질 측정 수행
    • 도출된 업무규칙과 측정 항목에 대한 품질 수준을 측정, 종합 품질 지수 산출.
  • 데이터 품질 측정 결과 보고
    • 프로파일링 결과, 업무규칙 도출 현황, 품질 현황 등 결과, 품질 진단 수행과정 전체 절차를 요약 보고.

품질 측정 계획 수립 #

품질 측정을 위한 상세 계획을 수립하고 각 절차의 수행자와 책임사항을 정의한다.

  • 수행절차
    • 데이터 품질을 측정하기 위한 상세 절차 또는 수행 내용 구분.
    • 구분된 각 상세 절차에 대해 수행 시간, 장소, 수행자, 사전 준비사항, 책임사항 등을 정의.
    • 선정된 진단 대상과 관련된 조직 및 업무 관련자들을 확인, 공지계획을 수립.
    • 수립된 상세실행계획은 품질 측정에 참여할 관련자들과 리뷰하여 내용 보완 및 공유.

품질 측정 체크리스트 준비 #

업무규칙과 품질측정 체크리스트를 통해 정형·비정형 데이터 유형에 따른 업무규칙과 측정 항목을 바탕으로 품질 측정에 사용할 체크리스트를 작성하고, 이를 토대로 품질 측정을 수행한다.

  • 수행절차
    • 데이터 유형에 따라 정의한 측정 방법을 통해 측정 항목에 대한 측정내용을 작성.
    • 준비된 업무규칙, 측정항목의 목록에 대한 중요도 평가, 내용 총건수, 오류 건수, 오류율, 등 측정 결과를 기록하기 위한 항목을 추가.

데이터 품질 측정 수행 #

품질 진단 대상 데이터 유형에 따라 도출된 업무규칙, 측정내용을 적용하여 오류데이터 및 오류율을 측정하여 품질 지수를 산출한다.

  • 수행절차
    • 도출된 업무규칙, 측정내용이 수록된 품질측정 체크리스트를 토대로 수록 내용을 실제 운영 중인 데이터베이스 및 콘텐츠에 적용, 오류데이터 발생 내역과 오류건수 추출.
    • 추출된 오류현황과 내역을 체크리스트별로 취합하여 목록 작성, 해당 체크리스트별 중요도나 품질기준 항목에 따라 품질 지수를 산출.

데이터 품질측정 결과 보고 #

프로파일링 결과, 업무규칙 도출 현황, 콘텐츠 유형별 측정 항목 및 측정 내용 도출 현황 등의 내용을 요약하여 담당자와 공유, 필요 시 오류 발생 원인 분석 및 개선 방안 등이 포함된 품질진단 전체 수행과정 및 절차를 요약하여 종합 보고를 수행할 수도 있다.

  • 수행절차
    • 측정 결과에 대한 해당 업무규칙별 중요도나 품질 기준 항목에 따라 품질 지수를 산출하여 업무규칙, 품질기준, 핵심정보항목별 품질 현황자료를 취합.
    • 품질 측정 결과 보고서를 작성하여 해당 업무전문가와 업무 담당자에게 전달.

데이터 품질 종합 보고서 작성 #

종합적 보고가 필요한 경우 진단 데이터의 품질진단 수행 과정의 요약 및 현황 등을 담당자에게 공유하여 향후 데이터 품질 개선 업무에 활용할 수 있도록 한다.

  • 수행절차
    • 진단 보고서 목차와 내용 및 범위를 결정.
    • 도출된 범위를 바탕으로 평가 보고서를 작성.
    • 작성된 보고서 검토.

데이터 품질 측정 결과 분석 #

데이터 품질 측정이 끝나면 오류 유형에 따른 원인을 분석하고 개선방안을 도출한다.

  • 품질 오류 원인 분석
    • 오류가 발생된 컬럼 또는 측정항목에 대한 품질기준별, 발생유형별 원인을 분석, 주요 사례를 정리.
  • 품질 개선 방안 도출
    • 주요 오류 원인별 개선 방안을 도출

품질오류 원인 분석 #

주요 오류데이터와 유형을 분석하고 원인을 파악하여 개선 방안을 도출한다.

  • 수행절차
    • 품질측정 단계에서 얻어진 오류 발생 자료를 바탕으로 준비하고 현황을 파악.
    • 오류가 발생하는 업무규칙, 또는 측정항목의 중요도, 오류율 등을 고려하여 우선순위를 선정.
    • 원인 분석 대상이 되는 업무규칙이나 측정항목에 대하여 데이터 품질측정결과 및 업무규칙 정의서 등을 토대로 오류 데이터 발생 주기 및 원인을 파악, 오류원인 분석서 및 조치 계획서를 작성.

품질 개선 방안 도출 #

  • 표준데이터, 모델데이터, 정형·비정형 데이터와 응용프로그램에 대한 각각의 변경 영향도 검토 과정을 거쳐 개선방안과 세부 수행 계획을 도출.
  • 개선방안은 데이터 정제, 변경, 재작성 등이 있고 각 개선사항에 대한 위험 분석, 중요도 등을 종합적으로 평가하여 우선순위를 부여.
  • 도출된 오류원인과 개선사항을 바탕으로 조치 계획서를 작성.
  • 개선활동 수행.

Image

변경영향도 분석서 예시 (출처)

Image

오류원인분석 및 조치계획서 예시 (출처)

0.0.1_20210630_7_v33