Database

[1강] 데이터 베이스 기본 개념

guineaa 2025. 3. 4. 21:26

✅1-1 데이터베이스 필요성

1) 데이터와 정보

  • 데이터(data): 현실 세계에서 단순히 관찰하거나 측정해 수집한 사실이나 값
  • 정보(information): 의사 결정에 유용하게 활용할 수 있도록 데이터를 처리한 결과물 (e.g. 데이터들을 모아서 가공해서 쓸모있는 형태로 만든다)
  • 정보처리(information processing): 데이터에서 정보를 추출하는 과정 또는 방법
  • (e.g. 주문내역 (정보처리)→ 총 판매액)

2) 정보 시스템과 데이터베이스

  • 정보 시스템(information system): 조직 운영에 필요한 데이터를 수집하여 저장해두었다가 필요할 때 유용한 정보를 만들어 주는 수단
  • 데이터 베이스: 정보 시스템 데이터를 저장하고 있다가 필요할 때 제공하는 역할 담당

데이터를 처리하고 정보로 우리에게 돌려주는것→ 정보 시스템

정보 시스템 안에 데이터베이스가 존재해야 한다.

 

필요로 하는 정보들만 조직화,체계화, 구조화 해서 하나로 묶어놓은 집합. → 데이터베이스

 

✅1-2 데이터 베이스의 정의와 특징

1) 데이터 베이스의 정의

특정 조직의 여러 사용자가 공유하여 사용할 수 있도록 통합하여 저장 운영 데이터의 집합
=> #공유데이터 #통합데이터 #저장데이터 #운영데이터

 

기존에는 파일 시스템으로 나누어 관리했지만 이제는 DB 정보를 통합해 하나로 관리한다.

저장된 데이터를 가지고 각각의 부서들이 접근해 운영한다

1. 공유 데이터: 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터

2. 통합 데이터: 최소의 중복과 통제 가능한 중복만 허용하는 데이터

3. 저장 데이터: 컴퓨터가 접근할 수 있는 매체에 저장된 데이터

4. 운영 데이터: 조직의 주요 기능을 수행하기 위해 지속적으로 필요한 데이터

2) 데이터베이스 특징

1. 실시간 접근성 (real-time accessibility): 사용자의 요구에 실시간으로 응답

2. 계속 변화 (continuous evolution): 데이터의 계속적인 삽입, 삭제, 수정을 통해 현재의 정확한 데이터를 유지

3. 내용 기반 참조 (content reference): 데이터가 저장된 주소나 위치가 아닌 내용으로 참고 가능

4. 동시 공유 (concurrent sharing): 서로 다른 데이터의 동시 사용 뿐만 아니라 같은 데이터의 동시 사용도 지원

 

✅1-3 데이터 과학 시대의 데이터

1) 구조화된 형태에 따른 데이터 분류

1. 정형 데이터 (미리 정해진 구조가 있음, Structed Data)

- 구조화된 데이터, 즉 미리 정해진 구조에 따라 저장된 데이터

- e.g.) 엑셀 스프레드 시트, 관계형 Database Table

 

2. 반정형 데이터 (내용 안에 구조에 대한 설명이 같이 있음)

- 구조에 따라 저장된 데이터 이지만, 데이터 내용 안에 구조에 대한 설명이 함께 존재.

- 구조를 파악하는 파싱 과정이 필요하고, 보통 파일 형태로 저장

- e.g.) HTML, XML, JSON, 센서데이터, 최근의 사진

 

3. 비정형 데이터 (정해진 구조가 없음)

- 정해진 구조가 없어 전처리 단계를 거친다.

- 소셜 데이터의 텍스트, 영상, 이미지, 음성, 워드, PDF

2) 특성에 따른 데이터의 분류

1. 범주형 데이터 (categorical data)

- 범주로 구분할 수 있는 값, 즉 종류를 나타냄

- 크기 비교와 산술적 연산이 가능하지 않아 질적 데이터라고도 한다.

1-1) 명목형 데이터 (nominal data) #서열X

- 순서, 즉 서열이 없는 값을 가지는 데이터  (e.g. 성별, 혈액형, ..)

1-2) 순서형 데이터 (ordinal data) #서열O

- 순서, 즉 서열이 있는 값을 가지는 데이터 (e.g. 학년, 학점, 등급..)

 

2. 수치형 데이터 (numerical data)

- 크기 비교와 산술적 연산이 가능한 숫자 값을 가진 데이터

- 양적 데이터라고도 한다.

2-1) 이산형 데이터 (discrete data) #단절

- 개수를 셀 수 있는 띄엄띄엄 단절된 숫자값 (고객 수, 판매량, 합격자 수)

2-2) 연속형 데이터 (continuous data) #연속

- 측정을 통해 얻어지는 연속적으로 이어지는 숫자 값을 가짐 (키, 몸무게, 온도, 점수)

 

3) 정성적 데이터와 정량적 데이터

1. 정성적 데이터 (qualitative data)

- 좁은 의미로는 범주형 데이터

- 사람의 주관적인 생각과 평가

2. 정량적 데이터 (quantitive data)

- 좁은 의미로는 수치형 데이터

- 객관적인 측정을 통해 수치나 도형 기호등으로 표현

- 저장 및 처리 측면에서 더 큰 비용이 듦

'Database' 카테고리의 다른 글

[3강] 데이터베이스 시스템의 정의  (0) 2025.03.18
[2강] 데이터베이스 관리 시스템  (0) 2025.03.11