본문 바로가기
통계 및 데이터분석

[빅데이터 분석 기사] 융합 데이터베이스 설계! 데이터 표준화, 모델링 (4)

by 연구잼 2024. 3. 21.
반응형

1. 융합 데이터베이스 설계

데이터 유형과 의미 파악하여 활용 목적별 융합 DB 설계.

구조화된 형태로 수집, 저장된 데이터 의미 파악하여 해당 데이터 활용할 수 있는 융합 DB로 재구성.

활용 업무데이터 요구사항 분석, 데이터 표준화 활동 및 모델링 과정 수행 필요

 

1) 요구사항 분석

-업무 활용 목적과 방향 파악, 어떤 데이터 속성이 필요한지 파악

-필요한 데이터 항목, 개인정보, 민감정보 포함 여부 식별

2) 데이터 표준화와 모델링 수행

  • 표준코드, 표준 용어, 데이터 도메인 등 정의.
  • 수집된 데이터로부터 엔티티와 애트리부트 추출하여 엔티티 간의 관계 정의 하는 개념적 설계와 관계형 스키마 작성하는 논리적 설계 수행.
  • 개념적 설계 수행: 엔티티, 애트리부트 추출하여 엔티티간의 관계 정의하고 ER 다이어그램을 그림.
  • 논리적 설계 수행: 작성된 ER 다이아그램 기반으로 매핑하여 관계형 스키마 만들어 냄.
  • 데이터 분석 용이성을 위해 정형화된 데이터베이스로 변환함에 집중.
  • 융합DB구성은 활용 업무 목적을 정확히 판단하는 것이 중요, 쉽게 자동화되도록 설계.

출처: 빅데이터분석기사 필기 이기적 기본서
출처: 빅데이터분석기사 필기 이기적 기본서

 

 

*엔티티: 데이터 베이스에서 실제로 저장되는 정보의 단위.

*애트리뷰트: 엔티티의 속성 또는 특성, 엔티티에 대한 구체적인 정보

*융합데이터베이스: 다양한 종류의 데이터 소스를 융합하여 하나의 데이터 베이스에서 관리할 수 있는 시스템.

* 엔티티: 인간이 생각하는 개념, 의미있는 정보 단위

* ER 다이어그램: Entity Relationship Diagram: 데이터베이스의 구조를 시각적으로 표현하는 도구

*스키마: 데이터베이스의 논리적, 물리적 구조 기술한 것.