자격증/빅데이터분석기사

2. 데이터베이스 - 빅데이터 분석기사 정리

InfHo 2023. 1. 22. 12:05

목차

     

    데이터베이스-관리-시스템
    DBMS

     

    데이터베이스의 정의

    데이터베이스는 전자적으로 저장되고 컴퓨터 시스템에서 액세스하고 관리할 수 있는 구조화된 데이터 모음입니다.

    정보를 쉽게 구성, 저장, 검색 및 조작할 수 있도록 설계되었습니다. 데이터베이스는 단순한 데이터 저장에서 복잡한 데이터 분석에 이르기까지 광범위한 애플리케이션에 사용할 수 있습니다. 금융, 의료, 정부 및 전자 상거래를 포함한 많은 산업에서 대량의 데이터를 관리하고 분석하는 데 사용됩니다. 데이터베이스는 관계형 데이터베이스 관리 시스템(RDBMS) 또는 NoSQL 데이터베이스와 같은 다양한 유형의 소프트웨어를 사용하여 구현할 수 있습니다.

     

    데이터베이스 관리 시스템

    DBMS의 정의

    데이터베이스 관리 시스템(DBMS)은 최종 사용자, 다른 응용 프로그램 및 데이터베이스 자체와 상호 작용하여 데이터를 캡처하고 분석하는 소프트웨어 응용 프로그램입니다. 

    DBMS는 데이터베이스의 기반이며 사용자가 데이터베이스에 저장된 데이터와 상호 작용할 수 있는 인터페이스를 제공합니다. DBMS는 데이터를 관리하고 일관성, 보안 및 무결성을 보장할 책임이 있습니다. DBMS는 관계형, 객체지향, 계층형, 네트워크, 문서지향으로 분류할 수 있다. 가장 널리 사용되는 DBMS는 MySQL, Oracle 및 MS SQL Server와 같은 관계형 데이터베이스와 MongoDB, Cassandra 및 Redis와 같은 NoSQL 데이터베이스입니다.

     

    DBMS의 종류

    관계형 DBMS 행과 열이 있는 테이블로 데이터를 구성하고 데이터 조작을 위한 기본 언어로 SQL을 사용합니다. 키를 사용하여 테이블 간의 관계를 생성할 수 있으며 가장 일반적으로 사용되는 DBMS 유형입니다.
    객체지향 DBMS 객체 지향 모델을 사용하여 데이터를 구성하며 복잡한 데이터 구조 및 관계가 필요한 애플리케이션에 자주 사용됩니다. 이것은 RDBMS의 확장이며 개체 및 클래스의 저장을 허용하므로 실제 엔터티 및 해당 관계를 모델링하는 데 유용합니다.
    네트워크 DBMS 네트워크 모델을 사용하여 데이터 요소 간의 다중 다대다 관계로 데이터를 구성합니다. 데이터는 포인터를 통해 다른 레코드에 연결된 레코드로 구성됩니다. 다른 유형의 DBMS보다 덜 사용됩니다.
    계층형 DBMS 계층적 모델을 사용하여 각 상위 노드에 여러 하위 노드가 있는 트리와 같은 구조로 데이터를 구성합니다. 데이터는 레코드로 구성되며 각 레코드에는 단일 부모와 여러 자식이 있습니다. 다른 유형의 DBMS보다 덜 사용됩니다.

     

    데이터베이스의 특징

    통합된 데이터 여러 소스의 데이터를 데이터베이스 내의 단일 통합 시스템으로 결합하는 프로세스를 말합니다. 이를 통해 데이터에 쉽게 액세스하고 관리할 수 있을 뿐만 아니라 새로운 방식으로 데이터를 상호 참조하고 분석할 수 있습니다.
    저장된 데이터 데이터베이스에 물리적으로 저장된 데이터를 말하며 사용자 및 응용 프로그램에서 액세스, 수정 및 쿼리할 수 있습니다.
    공용 데이터 웹 사이트 또는 정부 기관을 통해 공개적으로 사용할 수 있는 데이터와 같이 모든 사람이 액세스할 수 있는 데이터를 말합니다.
    변화되는 데이터 변경, 업데이트 및 삭제 대상 데이터를 말합니다. 이러한 유형의 데이터는 시스템의 현재 상태를 반영하기 위해 데이터를 자주 업데이트해야 하는 전자 상거래 또는 은행 시스템과 같은 트랜잭션 시스템에서 자주 사용됩니다.

     

    데이터베이스의 활용

    OLTP OLTP(Online Transaction Processing)는 실시간으로 데이터를 삽입, 업데이트 및 검색하는 것과 같이 짧고 간단한 대량의 트랜잭션을 처리하는 데 최적화된 일종의 데이터베이스 시스템입니다. 

    OLTP 시스템은 일반적으로 소매 판매 시스템, 은행 시스템 및 재고 관리 시스템과 같이 고성능과 빠른 응답 시간이 필요한 애플리케이션에 사용됩니다.
    OLAP OLAP(온라인 분석 처리)는 복잡하고 다차원적인 데이터 분석 및 보고에 최적화된 일종의 데이터베이스 시스템입니다. 

    OLAP 시스템은 일반적으로 비즈니스 인텔리전스, 재무 분석 및 데이터 웨어하우징과 같은 고급 데이터 분석 및 보고가 필요한 애플리케이션에 사용됩니다. OLAP 시스템은 많은 양의 기록 데이터와 함께 작동하도록 설계되었으며 데이터 삽입, 업데이트 또는 삭제가 아닌 데이터 읽기 및 집계에 최적화되어 있습니다.

     

    데이터-웨어하우스
    데이터 웨어하우스

     

    데이터 웨어하우스

    데이터 웨어하우스는 보고 및 분석을 위해 특별히 설계된 대규모 중앙 집중식 데이터 리포지토리입니다. 일반적으로 트랜잭션 시스템, 로그 파일 및 외부 데이터 소스와 같은 여러 소스의 데이터를 포함하며 조직의 의사 결정 및 전략 계획을 지원하는 데 사용됩니다.

     

    데이터 웨어하우스의 특징

    주제지향성 판매 또는 재무와 같은 특정 비즈니스 주제에 대한 데이터 보고 및 분석을 지원하도록 설계되었습니다.
    통합성 여러 이종 소스의 데이터를 하나의 통합된 보기로 가져옵니다.
    시계열성 시계열이므로 시간이 지남에 따라 변경되는 데이터를 처리하고 기록 추적을 지원하도록 설계되었습니다.
    비휘발성 비휘발성이므로 일단 데이터가 웨어하우스에 로드되면 일반적으로 업데이트되거나 삭제되지 않습니다.

     

    데이터 웨어하우스의 구성 요소

    데이터 소스 데이터 웨어하우스를 채우는 데 사용되는 데이터의 원래 소스입니다. 여기에는 트랜잭션 시스템, 운영 데이터베이스 및 외부 소스가 포함될 수 있습니다.
    ETL 이 도구는 다양한 소스에서 데이터를 추출하고 데이터 웨어하우스 스키마에 맞게 변환한 다음 데이터 웨어하우스에 로드하는 데 사용됩니다.
    데이터 웨어하우스 보고 및 분석에 최적화된 방식으로 데이터가 저장되고 구성되는 시스템의 주요 구성 요소입니다. 데이터 웨어하우스는 일반적으로 관계형 데이터베이스 관리 시스템을 사용하여 구현됩니다.
    데이터 마트 특정 부서 또는 비즈니스 기능에 맞게 조정된 데이터 웨어하우스의 하위 집합입니다. 데이터 마트는 전체 데이터 웨어하우스보다 더 작고 더 집중되어 있으므로 데이터에 더 빠르게 액세스할 수 있습니다.
    OLAP 이 도구는 데이터 웨어하우스의 데이터를 분석하는 데 사용됩니다. 사용자가 복잡한 쿼리 및 분석을 수행할 수 있도록 데이터의 다차원 보기를 제공합니다.
    보고 및 시각화 이 도구를 사용하면 데이터 웨어하우스의 데이터를 기반으로 보고서 및 시각화를 만들 수 있습니다. 데이터를 다른 사람에게 전달하는 데 사용할 수 있는 차트, 그래프 및 기타 유형의 시각화를 생성하는 데 사용할 수 있습니다.
    메타데이터 데이터 웨어하우스에 있는 데이터의 구조와 내용을 설명하는 데이터입니다. 메타데이터에는 데이터 소스, 데이터 요소 및 이들 간의 관계에 대한 정보가 포함될 수 있습니다.

     


    다음 글

     

    정보의 호텔에는 미래의 데이터 전문가가 되실 분들을 위해 빅데이터분석, 데이터분석에 관한 글을 아래의 페이지에 정리해 놓았습니다. 

     

    '자격증/빅데이터분석기사' 카테고리의 글 목록

    모든 분야의 정보를 담고 있는 정보의 호텔입니다.

    jkcb.tistory.com

    위 페이지는 빅데이터분석기사 / 데이터분석전문가 / 데이터분석준전문가 모두 유용하게 사용하실 수 있습니다.