데이터의 정의
데이터는 개별 자체로의 의미는 중요 하지 않고,fact(객관적인사실)에 중요.
데이터를 통하여 추론, 예측, 전망, 추정 한다. 하나의 데이터가 아닌, 다른 객채와 상호관계 속에서 가치를 갖는다
데이터의 유형 ★
Qualitative (정성적 데이터) 질적 데이터:
- 자료의 성질, 특징을 자세히 풀어 쓰는 방식
- 언어, 문자로 표현 (eg 기상특보, SNS 에 올린글, 주관식 조사)
- 비정형 데이터 형태로 저장, 분석에 시간과 비용이 필요
Quantitative data (정량적 데이터) 양적 데이터:
-수치, 기호, 도형 으로 표시(예시 : 온도,습도, 강우량, 풍속)
-데이터 양이증가 하더라도 저장과 분석이 용이함.
암묵지 VS 형식지
가장 널리 알려진 지식의 차원은 Polanyi 에 의해 구분된 "암묵지와 형식지"
암묵지(무형지식 via 경험) | 형식지(유형지식 via 유형지식) |
학습과 체험을 통해 개인이 습득 (현장 작업과 간은 경험을 통해서 획득) | 교과서 메뉴얼 비디오, DB등으로 형상화 된 지식을 의미 |
시행착오와 오랜 경험을 통해 개인에게 습득 | |
eg 김장김치담기, 자전거타기, 운전 | eg) 회계, 재무관련 대차대조표 요구 되는 지식의 메뉴얼 |
공유가 어려움 | 공유가 쉬움 |
암묵지와 형식지의 상호작용은 지식경영의 핵심 이슈!! |
※지식경영이란?
개인의 암묵지와 집단의 형식지가 나선형의 형태로 회전하면서 생성, 발전, 전환되는 지식의 발전을 기반으로 한 기업의 경영
암묵지, 형식지의 4단계 지식 전환모드 (위 사진 참고)★
1단계 : 공동화(socialization) : 암묵지 지식 노하우를 다른사람에게 알려주는것 (암-암)
2단계: 표출화( exteralization) : 암묵적 지식 노화우를 핵이나 교본등 형식지로 만드는것 (암-형)
3단계: 연결화(combination) : 책이나 교본( 형식지)에 자신이 알고 있는 새로운 지식(형식지)을 추가 하는것 (형-형)
4단계: 내면화(internalization) : 만들어진 책이나 교본(형식지)를 보고 다른 직원들이 암묵적인 지식(노하우)를 습득 (형-암)
데이터와 정보의 관계
Data -> Information -> Knowledge -> Wisdon 계층 구조
*data : 타 데이터와 상관관계가 없는 가공하기 전의 순수 수치나 기호 _ a 마트 100원, b 마트 200 원
information : 데이터 가공 및 상관/연관 관계속에서 의미가 도출된것_ a마트가 b 마트 보다 싸다
Knowledge : 상호연결된 정보 패턴을 이해 토대로 예측한 결과물_ 상대적으로 저렴한 a 마트에서 사야지
Wisdon: 근본원리에 대한 깊은이해 를 바탕으로 도출된 아이디어 _ a 마트가 다른 상품또한 b보다 저렴할듯.
Database 의 특징.
통합 데이터 (integrated) : 데이터베이스에 감은 내용의 데이터가 중복 되지 않는다 ( 중복을 제거함)
저장 데이터(stored) : 자기디스크나 자기테이프 등과 같이 컴퓨터가 접근할수 있는 저장 매체에 저장 되는것을 의미
공용 데이터(shared) : 여러 사용자에게 서로 다른 목적으로 데이터 베이스의 데이터를 공동으로 이용
변화 하는 데이터(changed) : 새로운 데이터의 추가, 기존 데이터의 삭제, 갱신으로 항상 변화 하면서도 항상 현재의 정확한 데이터를 유지 -> not 정량적 데이터 상태
Data-Base Management System(DBMS)
DBMS : 사용자와 데이터베이스 사이에 사용자의 요구에 따라 정보를 처리해주고 데이터베이스를 관리 해주는 소프트웨어.
DBMS or a Database Management System is the computer software that enables storing, manipulating, managing and securing a large set of data.
RDBMS(Relational Database Management System) | ODBMS(Objected-Orentied Database management system) |
관계형 데이터베이스 관리 시스템 : s a database system software that manages and maintains data in the tabular format. |
객체 지향데이터베이스 관리 시스템 |
정형화된 테이블로 구성된 데이터 항목들의 집합체 | 객체들을 생성하여 계층에서 체계적으로 정리하고, 다시 계층들을 하위 계층으로 부터 속성과 방법들을 물려 받을수 있는 DBMS |
MySQL(오픈소스,RDBMS), Oracle Database (상용 RDBMS) | 복잡한 데이터 구조를 표현 및 관리하는 DBMS |
SQL : RDBMS의 데이터를 관리하기위해 설계된 특수 목적의 프로그래밍 언어. :Structured Query Language is used to operate on the data stored in a databas 챔벌린과 데이먼드.F 보이스가 처음 개발 |
데이터베이스 셀계 절차 ★
요구조건분석 -> 개념적 설계 -> 논리적 설계 -> 물리적설계
*요구조건분석 : 데이터베이스 사용자, 사용목적, 사용범위, 제약조건 등을 정리. 명세서 작성.
개념적 설계 : E-R 모델, 정보를 추상적 개념으로 표현 하는 과정, DBMS 독립적 E-R다이어그램 작성.
논리적 설계 : 자료를 컴퓨터가 이해할수 있도록 DBMS 의 논리적인 자료 구조로 변환
물리적 설계 : 논리적 구조로 표현된 데이터를 물리적 구조의 데이터 변환 하는 과정
NoSQL
RDBMS 보다 덜 제한적인 일관성 모델을 이용 하는 데이터의 저장 및 검색을 위한 메커니즘 제공, 디자인 단순화, 수편적 확장성, 세세한 통제등을 포함
기존의 RDBMS가 갖고 있는 특성 뿐만 아니라 다른 특성을 부가적으로 지원함.
NoSQL 저장 방식 도구 : MongoDB , Apache HBase, Redis <------->MySQL(RDBMS)
MongoDB: 데이터 교환시 비산(BSON: Binary JSON) 문서 형대로 저장 하여 여러 서버에 분산 저장 및 확장이 용이 하며 방대한 데이터 처리가 용이, C++로 작성된
Apache HBase: 하둡 플랫폼을 위해 비관계성 분산데이터 데이타 베이스. 구글의 빅테이블을 본보기로 삼았으며, 자바로 쓰여졌다.
Redis: remote Ditionary Server "키-값' 구조의 비정형 데이터를 저장하고 관리 하기 위해 오픈소스의 비관계성 데이터관리 시스템
'Coming > ADsP' 카테고리의 다른 글
ADsp 과목 1 :기업 내부 DB (1) | 2022.10.05 |
---|---|
데이터 분석 기법의 이해 (0) | 2022.09.26 |