[정보처리기사 실기] 과목3 - 데이터 입출력 구현, 오답노트

CS/정보처리기사 2023. 7. 6. 23:41

Chapter ① 논리 데이터 저장소 확인

데이터 모델 절차

단계	모델	설명
요구조건 분석	-	- 도출된 요구사항 간 상충을 해결하고 범위를 파악하여 외부 환경과의 상호 작용을 분석을 통해 데이터에 대한 요구 분석
개념적 설계	개념적 데이터 모델	- 사용자의 요구에 대한 트랜잭션을 모델링 하는 단계 - 개념적 데이터 모델은 현실 세계에 대한 인식을 추상적, 개념적으로 표현하여 개념적 구조를 도출하는 데이터 모델 - 트랜잭션 모델링, View 통합방법 및 Attribute 합성 고려 - 개념적 데이터 모델은 DB 종류와 관계가 없음 - 주요 산출물은 개체관계 다이어그램(ERD)이 있음
논리적 설계	논리적 데이터 모델	- 트랜잭션의 인터페이스를 설계하는 단계 - DBMS에 맞는 논리적 스키마를 설계하는 단계 - 논리적 데이터 모델은 업무의 모습을 모델링 표기법으로 형상화하여 사람이 이해하기 쉽게 표현한 데이터 모델 - 논리적 설계 단계에서 정규화를 수행 - 논리적 데이터베이스 구조로 매핑(Mapping) - 스키마의 평가 및 정제 - 논리적 데이터 모델을 통해 "관계 데이터 모델", "계층 데이터 모델", "네트워크 데이터 모델", "객체 지향 데이터 모델", "객체-관계 데이터 모델" 중 하나의 모델에 맞게 설계 - 관계형 데이터베이스에서는 테이블을 설계하는 단계
물리적 설계	물리적 데이터 모델	- 물리적 설계는 논리 데이터 모델을 특정 DBMS의 특성 및 성능을 고려하여 물리적인 스키마를 만드는 단계 - 물리적 데이터 모델은 논리 데이터 모델을 사용하고자 하는 각 DBMS의 특성을 고려하여 데이터베이스 저장 구조(물리 데이터 모델)로 변환하는 모델 - 테이블(Table), 인덱스(Index), 뷰(View), 파티션(Partition) 등 객체를 생성 - 응답시간, 저장 공간의 효율화, 트랜잭션 처리를 고려하여 설계 - 성능 측면에서 반 정규화를 수행 - 레코드 집중의 분석 및 설계 - 저장 레코드 양식 설계 - 접근 경로(Access Path) 설계

데이터 모델 표시요소

표시요소	설명
연산 (Operation)	- 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세 - 릴레이션을 조작하기 위한 관계 연산을 나타냄(SELECT, PROJECT, JOIN, DIVISION)
구조 (Structure)	- 데이터베이스에 논리적으로 표현될 대상으로서의 개체 타입과 개체 타입 간의 관계 - 데이터 구조 및 정적 성질을 표현하는 요소
제약 조건 (Constraint)	- 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건 - 데이터 무결성 유지를 위한 DB의 보편적 방법 - 릴레이션의 특정 칼럼에 설정하는 제약을 의미(개체 무결성, 참조 무결성 등)

순수 관계 연산자

연산자	기호	표현	설명
셀렉트 (Select)	σ	σ 조건 (R)	릴레이션 R에서 조건을 만족하는 튜플 반환
프로젝트 (Project)	π	π 속성리스트 (R)	릴레이션 R에서 주어진 속성들의 값으로만 구성된 튜플 반환
조인 (Join)	⋈	R ⋈ S	공통 속성을 이용해 R과 S의 튜플들을 연결해 만들어진 튜플 반환
디비전 (Division)	÷	R ÷ S	릴레이션 S의 모든 튜플과 관련 있는 R의 튜플 반환

데이터베이스 이상 현상

이상 현상	설명
삽입 이상	정보 저장 시 해당 정보의 불필요한 세부정보를 입력해야 하는 경우
삭제 이상	정보 삭제 시 원치 않는 다른 정보가 같이 삭제되는 경우
갱신 이상	중복 데이터 중에서 특정 부분만 수정되어 중복된 값이 모순을 일으키는 경우

반 정규화(De-Normalization) 개념

반 정규화는 정규화된 엔터티, 속성, 관계에 대해 성능 향상과 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 데이터 모델링의 기법이다.

개체-관계(E-R) 모델 개념

E-R 모델은 현실 세계에 존재하는 데이터와 그들 간의 관계를 사람이 이해할 수 있는 형태로 명확하게 표현하기 위해서 가장 널리 사용되고 있는 모델이다.
논리 데이터 모델링에서는 모든 이해당사자와 의사소통의 보조 자료로 E-R 모델을 활용한다.
요구사항으로부터 얻어낸 정보들을 개체, 속성, 관계로 기술한 모델이다.

이상 현상(Anomaly)

데이터의 중복성으로 인해 릴레이션을 조작할 때 발생하는 비합리적 현상이다.

보이스-코드 정규형(BCNF)

3차 정규형을 만족하면서 모든 결정자가 후보키가 되도록 하여 결정자 함수 종속성을 제거하는 단계이다.

개체관계 다이어그램(ERD: Entity Relationship Diagram)의 개념

각 업무 분석에서 도출된 엔터티 간의 관계를 이해하기 쉽게 도식화한 다이어그램이다.

Chapter ② 물리 데이터 저장소 설계

물리 데이터 모델링 개념

물리 데이터 모델링은 논리모델을 적용하고자 하는 기술에 맞도록 상세화해가는 과정이다.

인덱스 컬럼 선정

분포도가 좋은 컬럼은 단독적으로 생성한다.
자주 조합되어 사용되는 컬럼은 결합 인덱스로 생성한다.
결합 인덱스는 구성되는 컬럼 순서 선정(사용빈도, 유일성, 정렬 등)에 유의한다.
가능한 한 수정이 빈번하지 않은 컬럼을 선정한다.

인덱스 개념

검색 연산의 최적화를 위해 데이터베이스 내 열에 대한 정보를 구성한 데이터구조이다.
인덱스를 통해 전체 데이터의 검색 없이 필요한 정보에 대해 신속한 조회가 가능하다.

Chapter ③ 데이터 입출력 구현

데이터 마이닝(Data Minning) 개념

대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술이다.
데이터 마이닝은 대규모 데이터에서 의미 있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 기법이다.

데이터베이스(Database) 개념

데이터베이스는 다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합이다.

계층형 데이터베이스 관리시스템(HDBMS: Hierarchical Database Management System)

계층형 DBMS는 데이터를 상하 종속적인 관계로 계층화하여 관리하는 데이터베이스이다.
데이터에 대한 접근 속도가 빠르지만, 종속적인 구조로 인하여 변화하는 데이터 구조에 유연하게 대응하기가 쉽지 않다.
HDBMS 종류는 IMS(Information Management System), System2000 등이 있다.

https://hongong.hanbit.co.kr/%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B2%A0%EC%9D%B4%EC%8A%A4-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0-databasedb-dbms-sql%EC%9D%98-%EA%B0%9C%EB%85%90/

DBMS 특징

특징	설명
데이터 무결성	부적절한 자료가 입력되어 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질
데이터 일관성	삽입, 삭제, 갱신, 생성 후에도 저장된 데이터가 변함없이 일정
데이터 회복성	장애가 발생하였을 시 특정 상태로 복구되어야 하는 성질
데이터 보안성	불법적인 노출, 변경, 손실로부터 보호되어야 하는 성질
데이터 효율성	응답 시간, 저장 공간 활용 등이 최적화되어 사용자, 소프트웨어, 시스템 등의 요구 조건을 만족시켜야 하는 성질

HDFS(Hadoop Distributed File System)

대용량 데이터의 집합을 처리하는 응용 프로그램에 적합하도록 설계된 하둡 분산 파일 시스템이다.

맵 리듀스(Map Reduce)

구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작하여 2004년에 발표한 소프트웨어 프레임워크이다.

NoSQL(Not Only SQL)의 개념

NoSQL은 전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로 데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인(Join) 연산을 사용할 수 없으며, 수평적으로 확장이 가능한 DBMS이다.

NoSQL의 특성(BASE)

특성	설명
Basically Available	- 언제든지 데이터는 접근할 수 있어야 하는 속성 - 분산 시스템이기 때문에 항상 가용성 중시
Soft-State	- 노드의 상태는 내부에 포함된 정보에 의해 결정되는 것이 아니라 외부에서 전송된 정보를 통해 결정되는 속성 - 특정 시점에서는 데이터의 일관성이 보장되지 않음
Eventually Consistency	- 일정 시간이 지나면 데이터의 일관성이 유지되는 속성 - 일관성을 중시하고 지향

Column Family Data Store

Key 안에 (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DB

온톨로지(Ontology)

실세계에 존재하는 모든 개념들과 개념들의 속성, 그리고 개념들 간의 관계 정보를 컴퓨터가 이해할 수 있도록 서술해 놓은 지식베이스이다.

텍스트 마이닝(Text Mining)

대량의 텍스트 데이터로부터 패턴 또는 관계를 추출하여 의미 있는 정보를 찾아내는 기법이다.
비정형, 반정형 데이터에 대하여 자연어, 문서 처리기술을 적용하여 의미 있는 정보를 추출한다.

DBMS(Database Management System) 개념

DBMS는 데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안 등의 기능을 지원하는 소프트웨어이다.

Reference

https://www.yes24.com/Product/Goods/105812550

2022 수제비 정보처리기사 실기 (1권+2권 합본세트) - YES24

NCS 기반으로 재구성한 합격비법서로 NCS 기반 반영 문제(예상문제, 단원종합문제, 모의고사, 2021년 기출문제)를 수골하였다. 2022년 합격을 위한 NCS 기반 모의고사, 궁극의 암기비법(두음 쌤)과 학

www.yes24.com

저작자표시 (새창열림)

'CS > 정보처리기사' 카테고리의 다른 글

[정보처리기사 실기] 과목5 - 인터페이스 구현, 오답노트 (0)	2023.07.10
[정보처리기사 실기] 과목4 - 통합 구현, 오답노트 (0)	2023.07.09
[정보처리기사 실기] 과목2 - 화면 설계, 오답노트 (0)	2023.07.04
[정보처리기사 실기] 과목1 - 요구사항 확인, 오답노트 (0)	2023.07.03
[정보처리기사 필기] 알고리즘 (Algorithm) (0)	2023.06.29

ABOUT ME

Logbook Logbook

'CS > 정보처리기사' 카테고리의 다른 글

티스토리툴바

ABOUT ME

'CS > 정보처리기사' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바