data analysis & visualization

1. 데이터 베이스의 구조

2. 데이터 독립성 요소

   1) 외부스키마 

   View 단계 여러 개의 사용자 관점으로 구성

   개개 사용자 단계로서 개개 사용자가 보는 개인적 DB스키마

 

   2) 개념스키마

   하나의 개념스키마로 모든 사용자 관점을 통합한 조직 전체 DB를 기술하는 것

   3) 내부스키마

   DB가 물리적으로 저장된 형식

   물리적 장치에서 데이터가 실제적으로 저장되는 방법을 표현하는 스키마

 

   4) 논리적 독립성

   개념스키마가 변경되어도 외부스키마에 영향을 미치지 않도록 지원하는 것

   논리적구조가 변경되어도 응용프로그램에 영향이 없음

 

   5) 물리적 독립성

   내부스키마가 변경되어도 외부, 개념스키마에 영향을 미치지 않도록 지원하는 것

   저장장치의 구조변경시에도 응용프로그램과 개념스키마에 영향이 없음

 

3. 사상

   외부적/내부적 사상(논리적 사상) : 외부적 뷰와 개념적 뷰의 상호 관련성을 정의

   개념적/내부적 사상(물리적 사상) : 개념적 뷰와 저장된 DB와의 상호 관련성을 정의

 

   1) 데이터모델링의 세가지 중요 개념

   업무가 관여하는 어떤 것 - 단수 : 엔터티(entity)/복수 : 인스턴스(instance), 어커런스(occurrence)

   어떤 것이 가지는 성격(attributes) - 단수 : 속성(attribute)/ 복수 : 속성값(attribute value)

   업무가 관여하는 어떤 것 간의 관계 - 단수 : 관계(relationship)/복수 : 페어링(pairing)

 

   2) 관계흐름도(ERD) 작업 순서

   1. 엔터티를 그린다.

   2. 엔터티를 배치한다.

   3. 엔터티 간 관계를 설정한다. 

    - PK로 속성되는 관계를 설정하도록 한다.

    - 중복관계나 cicile 관계에 유의하여 작성

   4. 관계명을 기술한다. (현재형을 사용)

   5. 관계의 참여도 기술

   6. 관계의 필수여부 기술

 

4. 좋은 데이터 모델의 요소

   완전성 : 업무에서 필요로하는 모든 데이터가 데이터 모델에 정의

   중복배제 : 하나의 DB에 동일한 사실은 반드시 한번만 기록

   업무규칙 : 업무규칙이 데이터 모델에 표현되고 이를 모든 사용자가 공유할 수 있도록 제공

   데이터 재사용 : 데이터의 통합성과 독립성에 대해 충분히 고려

    - 애플리케이션으로부터 독립적으로 설계되어야 재사용성 향상

    - 확장성과 유연성에 초점

   의사소통 : 자료분석과정에서 자연스럽게 많은 업무규칙이 도출

   통합성 : 동일데이터는 조직의 전체에서 한번만 정의되고 이를 여러 다른 영역에서 참조