자격증/ADSP

[Adsp] 1-1장 데이터의 이해

동호다찌 2023. 1. 30. 12:22

 

1절 데이터와 정보

1-1. 데이터의 정의와 특성

데이터의 정의

데이터는 추론과 추정의 근거를 이루는 사실이다.

데이터는 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명되고 있다.

 

데이터의 특성

존재적 특성 : 객관적 사실

당위적 특성 : 추론, 예측 전망, 추정을 위한 근거

 

1-2. 데이터의 유형

구분 형태 예시 특징
정성적 데이터 언어, 문자 등 회사 매출이 증가함 등 저장, 검색, 분석에 많은 비용이 소모됨
정량적 데이터 수치, 도형, 기호 등 나이, 몸무게, 주가 등 정형화된 데이터로 비용 소모가 적음

정성적 데이터 

- 비정형 데이터이며 주관적인 내용으로 통계분석이 어렵다

 

정량적 데이터

- 정형 데이터이며 객관적인 내용으로 통계분석이 용이하다.

 

1-3. 지식경영의 핵심 이슈

데이터는 지식경영의 핵심 이슈인 암묵지와 형식지의 상호작용에 중요한 역할을 한다.

구분 의미 특징 상호작용
암묵지 학습과 경험을 통해 개인에게 체화되어 있지만
겉으로 드러나지 않는 지식
김장김치, 자전거 타기 등 사회적으로 중요하지만 다른사람에게는 공유하기 어려움 공통화, 내면화
형식지 문서나 매뉴얼처럼 형상화된 지식 교과서, 비디오, DB 전달과 공유가 용이함 표출화, 연결화

* 암묵지란? 개인에게 축적된 내면화된 지식

* 형식지란? 언어, 기호, 숫자로 표출화된 지식

암묵지와 형식지의 상호작용 관계
1단계 : 공통화 (암묵지를 타인에게 알려주기)
2단계 : 표출화 (암묵지를 책 등 형식지로 만들기)
3단계 : 연결화 (책 등에 자신이 아는 새로운 지식 추가하기)
4단계 : 내면화 (책 등을 보고 타인들이 암묵적 지식 습득)

 

1-4. 데이터와 정보의 관계

DIKW의 정의

구분 특성
데이터 (DATA) 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실
정보 (INFORMATION) 데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가 도출된 것
지식 (KNOWLEDGE) 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜
고유의 지식으로 내재화된 것
지혜 (WISDOM) 지식의 축적과 아이디어가 결합된 창의적인 산물

 

DIKW 피라미드

데이터

  • 존재 형식을 불문하고, 타 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호를 의미
  • 예) a마트는 100원에, b마트는 200원에 연필을 판매한다.

정보

  • 데이터의 가공 및 상관관계 간 이해를 통해 패턴을 인식하고 그 의미를 부여한 데이터
  • a마트의 연필이 더 싸다.

지식

  • 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물
  • 상대적으로 저렴한 a마트에서 연필을 사야겠다.

지혜

  • 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어
  • a마트의 다른 상품들도 b마트보다 쌀 것이라고 판단한다.

 


2절 데이터베이스 정의와 특징

2-1. 데이터베이스 용어의 연혁

1950년대 : 미군에서 군비상황을 집중 관리하기 위하여 컴퓨터 도서관을 설립하면서 데이터의 기지라는 뜻으로 데이터베이스 용어 탄생

1963년대 : 미국 "SDC"가 개최한 심포지엄에서 데이터베이스 용어 공식 사용 및 데이터베이스 관리 시스템 IDS 개발

1965년대 : 2차 심포지엄에서 시스템을 통한 체계적인 관리와 저장을 의미하는 데이터베이스 시스템 용어 등장

1970년대 : 유럽에서 데이터베이스라는 단일어가 일반화됨

1975년대 : 미국의 CAC가 KORSTIC을 통해 서비스되면서 한국에서 데이터베이스 이용이 이루어짐

1980년대 : 온라인 정보검색 서비스를 개시하여 본격적인 데이터베이스 서비스 시대를 맞이, 국내의 데이터베이스 관련 기술의 연구 개발

 

2-2. 데이터베이스의 정의

1차 개념확대 (정형 데이터 관리)

  • EU(데이터베이스의 법적 보호에 관한 지침)
    • 체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물
  • 국내 저작권법
    • 소재를 체계적으로 배열 또는 구성한 편집물로서 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것

2차 개념확대 (빅데이터 출현으로 비정형데이터 포함)

  • 국내 'wikipedia'
    • 관련된 레코드의 집합, 소프트웨어로는 데이터베이스관리시스템을 의미
  • 국내 '데이터분석 전문가 가이드'
    • 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축척하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체

 

2-3. 데이터베이스의 특징

데이터베이스의 일반적인 특징

특징 설명
통합된 데이터 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미하며 데이터 중복은 관리상의 복잡합 부작용을 초래
저장된 데이터 자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장 매체에 저장된 것을 의미
공용 데이터 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미, 대용량화되고 구조가 복잡한 것이 특징
변화되는 데이터 데이터베이스에 저장된 내용은 곧 현 시점에서의 데이터베이스 상태를 나타낸다. 다만 이 상태는 새로운 데이터의 삽입, 삭제, 갱신으로 항상 변화되면서도 항상 현재의 정확한 데이터를 유지해야한다.

 

데이터베이스의 다양한 측면에서의 특징

측면 특성
정보의 축적 및 전달 측면 기계 가독성 : 일정한 형식에 따라 컴퓨터 등의 정보처리기기가 읽고 쓸 수 있음

검색 가독성 : 다양한 방법으로 필요한 정보를 검색

원격 조장성 : 정보통신망을 통하여 원거리에서도 즉시 온라인을 이용
정보 이용 측면 이용자의 정보 요구에 따라 다양한 정보를 신속하게 획득

원하는 정보를 정확하고 경제적으로 찾아낼 수 있다는 특성
정보 관리 측면 정보를 일정한 질서와 구조에 따라 정리, 저장, 검색, 관리 할 수 있도록 하여 방대한 양의 정보를 체계적으로 축적하고 새로운 내용의 추가나 갱신이 용이
정보기술 발전 측면 데이터 베이스는 정보처리, 검색 및 관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술의 발전을 견인할 수 있다.
경제, 산업 측면 다양한 정보를 필요에 따라 신속하게 제공, 이용할 수 있는 인프라라는 특성을 가지고 있어 경제, 산업, 사회 활동의 효율성을 제고하고 국민의 편의를 증지하는 수단으로서 의미를 가진다.

 


3절 데이터베이스의 활용

3-1. 기업내부 데이터베이스

1980년대 기업내부 데이터베이스

OLTP (On-Line Transaction Processing)

호스트 컴퓨터와 온라인으로 접속된 여러 단말 간의 처리 형태의 하나이다. 여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 액세스 하고, 바로 처리 결과를 돌려보내는 형태이다.

 

OLAP (On-Line Analytical Processing)

정보 위주의 분석 처리를 의미하며, 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술이다.

 

OLTP OLAP 비교

구분 OLTP OLAP
데이터 구조 복잡 단순
데이터 갱신 동적으로 순간적 정적으로 주기적
응답 시간 수 초 이내 수 초에서 몇 분 사이
데이터 범위 수 십일 전후 오랜 기간 저장
데이터 성격 정규적인 핵심 데이터 비정규적인 읽기 전용 데이터
데이터 크기 수 기가 바이트 수 테라 바이트
데이터 내용 현재 데이터 요약된 데이터
데이터 특성 트랜잭션 중심 주제 중심
액세스 빈도 높음 낮음
질의 결과 예측 주기적이며 예측 가능 예측하기가 어려움

 

2000년대 기업내부 데이터베이스

CRM (Customer Relationship Management)

고객관계관리라고 하며, 기업이 고객과 관련된 내, 외부 자료를 분석 및 통합해 고객 중심 자원을 극대화하고, 이를 토대로 고객 특성에 맞게 마케팅 활동을 계획하고 지원하여 평가하는 과정이다.

 

SCM (Supply Chain Management)

공급망 관리를 뜻하는 말로, 기업에서 원재료의 생산, 유통 등 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공하는 것이다.

 

각 분야 별 내부 데이터 베이스

분야 분야 별 데이터베이스
제조 ERP (Enterprise Resource Planning)
인사, 재무, 생산 등 전 부문에 걸쳐 독립적으로 운영되던 각종 관리 시스템의 경영자원을 하나의 통합 시스템으로 재구축함으로써 생산성을 극대화하려는 경영혁신기법이다.

BI (Business Intelligence)
비즈니스 인텔리전스란 기업이 보유하고 있는 수많은 데이터를 정리하고 분석해 기업의 의사결정에 활용하는 일련의 프로세스를 말한다.

CRM (Customer Relationship Managemet)
고객관계관리라고 하며 기업이 고객과 관련된 내외부 자료를 분석 및 통합해 고객 중심 자원을 극대화하고 이를토대로 고객특성에 맞게 마케팅 활동을 계획하고 지원하여 평가하는 과정이다.

RTE (Real Time Enterprise)
회사의 주요 경영정보를 통합관리하는 실시간 기업의 새로운 경영시스템이다. 회사 전 부문의 정보를 하나로 통합함으로써 경영자의 빠른 의사 결정을 이끌어 내려는 목적에서 만들어졌다.
금융 EAI (Enterprise Application Integration)
기업 내 상호 연관된 모든 애플리케이션을 유기적으로 연동하여 필요한 정보를 중앙 집중적으로 통합, 관리, 사용할 수 있는 환경을 구현하는 것

EDW (Enterprise Data Warehouse)
기존 데이터웨어하우스를 전사적으로 확정된 모델로 다양한 분석 애플리케이션들을 위한 원천이된다. 따라서 EDW를 구축하는 것은 단순히 정보를 빠르게 전달하는 대형 시스템을 도입하는 의미가 아니라 기업 리소스의 유기적인 통합, 다원화된 관리 체계 장비, 데이터의 중복 방지 등을 위해 시스템을 재설계하는 것을 의미한다.
유통 KMS (Knowledge Management System)
지식관리시스템을 의미하며, 기업의 환경이 물품을 주로 생산하던 산업사회에서 지적 재산의 중요성이 커지는 지식사회로 급격히 이동함에 따라, 기업 경영을 지식이라는 관점에서 새롭게 조명하는 접근방식이다.

RFID (Radio Frequency, PF)
주파수를 이용해 id를 식별하는 시스템으로 일명 전자태그라고 불리며 전파를 이용해 먼 거리에서 정보를 인식하는 기술이다.

 

사회 기반 구조로서의 데이터베이스

EDI (Electronic Data Interchange)

주문서, 납품서, 청구서 등 무역에 필요한 각종 서류를 표준화된 양식을 통해 전자적 신호로 바꿔 컴퓨터통신망을 이용하여 거래처에 전송하는 시스템이다.

 

VAN (Value Added Network)

부가가치통신망으로 한국전기통신공사로부터 통신회선을 차용하여 독자적인 네트워크를 형성하는 것이다. 독자적인 네트워크로 각종 정보를 부호, 영상, 음성 등으로 교환하거나 정보를 축적하거나 또는 복수로 해서 전송하는 등 단순한 통신이 아니라 부가가치가 높은 서비스를 하는 것이다.

 

CALS (Commerce At Light Speed)

전자상거래 구축을 위해 기업 내에서 비용 절감과 생산성 향상을 추구할 목적으로 시작된, 제품의 설계, 개발, 생산에서 유통, 폐기에 이르기까지 제품의 라이프 사이클 전반에 관련된 데이터를 통합하고 공유, 교환할 수 있도록 한 경영통합정보시스템을 말한다.

 

분야별 사회기반 구조의 데이터베이스

분야 솔류션
물류 CVO (Commercial Vehicle Operation System, 화물운송정보시스템)
PORT-MIS (항만운영정보시스템)
KROIS (철도운영정보시스템)
지리/교통 GIS (Geographic Information System, 지리정보시스템)
RS (Remote Sensing, 원격탐사)
GPS (Global Postitioning System, 범지구위치결정시스템)
ITS (Intelligent Transport System, 지능형교통시스템)
LBS (Location Based System, 위치기반서비스)
SIM (Spatical Information Management, 공간정보관리)
의료 PACS (Picture Archiving and Communication System)
U헬스 (Ubiquitous-Health)
교육 NEIS (National Education Information System,교육행정정보시스템)