반응형
목차
01. 데이터베이스의 필요성
1. 데이터와 정보
정보와 데이터는 명확히 구별해야 되는 개념이다.
- 데이터(data) : 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실(fact)이나 값(value)으로, 자료라고도 한다.
- 정보(information) : 데이터를 의사 결정에 유용하게 활용할 수 있도록 처리하여 체계적으로 조직한 결과물
데이터에서 정보를 추출하는 과정 또는 방법을 정보 처리(information processing)라 한다. 즉, 정보 처리는 데이터를 상황에 맞게 분석하거나 해석하여 데이터 간의 의미 관계를 파악하는 것이다.
2. 정보 시스템과 데이터베이스
조직 운영에 필요한 데이터를 수집하여 저장해두었다가 의사 결정이 필요할 때 처리하여 유용한 정보를 만들어주는 수단을 정보 시스템(Information System)이라 한다. 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 핵심 역할은 데이터베이스가 담당한다.
02. 데이터베이스의 정의와 특징
1. 데이터베이스의 정의
특정 조직의 여러 사용자가 '공유'하여 사용할 수 있도록 '통합'해서 '저장'한 '운영' 데이터의 집합
- 공유 데이터(shared data)
-> 데이터베이스는 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터이므로 사용 목적이 다른 사용자들을 고려하여 구성되어야 한다. - 통합 데이터(integrated data)
-> 데이터의 중복을 최소화하고 통제가 가능한 중복만 허용해야 한다. - 저장 데이터(stored data)
-> 주로 컴퓨터가 데이터를 처리하므로, 컴퓨터가 접근할 수 있는 매체에 데이터베이스를 저장해야 한다. - 운영 데이터(operational data)
-> 데이터베이스는 조직을 운영하고 조직의 주요 기능을 수행하기 위해 필요하므로 지속적으로 유지해야 한다.
2. 데이터베이스의 특징
- 실시간 접근(real-time accessibitlity)이 가능
-> 사용자의 데이터 요구에 실시간으로 응답할 수 있어야 한다. - 계속 변화(continuous evolution)
-> 현실 세계의 상태를 정확히 반영해야 하므로 데이터베이스에 저장된 데이터는 계속 변해야 한다. - 동시 공유(concurrent sharing) 가능
-> 여러 사용자가 동시에 이용할 수 있다. - 내용으로 참조(content reference) 가능
-> 저장된 주소나 위치가 아닌 데이터의 내용, 즉 값으로 참조할 수 있다.
03. 데이터와 데이터베이스
데이터는 형태에 따라 정형 데이터, 반정형 데이터, 비정형 데이터로 분류할 수 있다.
1. 정형 데이터(structured data)
- 미리 정해진 구조에 따라 저장된 데이터다.
- 데이터 구조에 대한 설명과 데이터 내용은 별도로 유지된다.
- 미리 정해진 데이터 구조를 스키마(schema)라고 한다.
2. 반정형 데이터(semi-structured data)
- 정형 데이터와 달리 데이터 내용 안에 구조에 대한 설명이 함께 존재한다.
- 따라서 데이터 내용에 대한 설명, 즉 구조를 파악하는 파싱 과정이 필요하고, 보통 파일 형태로 저장된다.
- HTML, XML, JSON 문서 등이 이에 해당한다.
3. 비정형 데이터(unstructured data)
- 정해진 구조가 없이 저장된 데이터다.
- SNS의 텍스트, 영상, 워드나 PDF 문서와 같은 멀티미디어 데이터가 이에 해당한다.
Reference
반응형
'CS > DB' 카테고리의 다른 글
[DB - 데이터베이스 개론] Chapter 05. 관계 데이터 모델 (0) | 2022.01.21 |
---|---|
[DB] 트랜잭션(Transaction)이란? (0) | 2022.01.18 |
[DB - 데이터베이스 개론] Chapter 04. 데이터 모델링 (0) | 2022.01.17 |
[DB - 데이터베이스 개론] Chapter 03. 데이터베이스 시스템 (0) | 2022.01.15 |
[DB - 데이터베이스 개론] Chapter 02. 데이터베이스 관리 시스템 (0) | 2022.01.15 |
댓글