자격증/빅데이터분석기사

3. 빅데이터 개요 - 빅데이터 분석기사 정리

InfHo 2023. 1. 24. 12:28

목차

     

    5V-모델
    5V 모델

     

    빅데이터의 등장과 변화

    빅데이터의 등장 배경

    1. 기술의 발전: 디지털 장치, 인터넷 및 클라우드의 확산으로 인해 상대적으로 저렴한 비용으로 많은 양의 데이터를 수집, 저장 및 처리할 수 있게 되었습니다.
    2. 데이터 생성 활동의 증가: 소셜 미디어, 모바일 장치 및 사물 인터넷(IoT)의 성장으로 그 어느 때보다 많은 데이터가 생성되고 있습니다.
    3. 더 나은 의사 결정의 필요성: 조직은 데이터 기반 의사 결정의 가치와 경쟁 우위를 확보하기 위해 대규모 데이터 세트에서 통찰력을 추출해야 할 필요성을 점차 인식하고 있습니다.
    4. 데이터 과학 및 분석의 부상: 데이터의 양과 복잡성이 증가함에 따라 데이터를 처리하고 분석하기 위한 전문 도구와 기술의 필요성도 증가했습니다. 이로 인해 Hadoop, NoSQL 데이터베이스 및 기계 학습과 같은 새로운 기술 및 방법론이 개발되었습니다.
    5. 데이터 규제의 증가: 정부와 산업계는 개인 데이터를 보호하기 위한 규제를 시행하고 있으며, 이로 인해 데이터 거버넌스, 개인 정보 보호 및 보안을 처리할 수 있는 빅 데이터 솔루션에 대한 필요성이 증가하고 있습니다.

     

    빅데이터의 등장으로 인한 변화

    1. 비즈니스: 기업은 이제 많은 양의 데이터를 수집, 저장 및 분석하여 통찰력을 얻고 운영을 개선하며 더 나은 결정을 내릴 수 있습니다. 이는 새로운 비즈니스 모델과 수익원의 개발로 이어졌습니다.
    2. 기술: 빅 데이터를 처리하기 위해 Hadoop, NoSQL 데이터베이스 및 분산 컴퓨팅과 같은 새로운 기술이 개발되어 대량의 데이터를 저장, 처리 및 분석할 수 있습니다. 이러한 기술은 실시간 데이터 처리를 가능하게 하여 사기 탐지, 개인화된 마케팅 및 고객 서비스와 같은 애플리케이션에 사용할 수 있습니다.
    3. 분석: 빅 데이터는 기계 학습, 딥 러닝 및 예측 모델링과 같은 새로운 분석 방법의 개발로 이어져 조직이 대규모 데이터 세트에서 통찰력을 추출할 수 있습니다.
    4. 운영: 빅 데이터는 IT에서 고객 서비스, 물류에서 공급망 관리에 이르기까지 조직 운영 방식의 변화를 가져왔습니다. 또한 데이터 과학자, 데이터 엔지니어 및 데이터 분석가와 같은 새로운 역할의 창출로 이어졌습니다.
    5. 사회: 빅데이터는 새로운 서비스와 제품의 창출로 이어졌고, 우리가 서로 그리고 기술과 상호 작용하는 방식에도 변화를 가져왔습니다. 또한 개인 정보 보호에 대한 우려와 개인 정보를 보호하기 위한 새로운 규정 및 정책의 필요성으로 이어졌습니다.

     

    빅데이터의 특징 5V

    규모 Volume 생성되고 수집되는 대량의 데이터를 의미합니다. 빅 데이터는 테라바이트, 페타바이트 또는 엑사바이트의 데이터 형태일 수 있습니다.
    유형 Variety 이것은 정형 데이터(데이터베이스의), 반정형 데이터(XML 및 JSON 파일의), 비정형 데이터(소셜 미디어, 이메일 및 텍스트의)와 같이 빅 데이터에 포함된 다양한 유형의 데이터를 나타냅니다. 서류).
    속도 Velocity 데이터가 생성되고 수집되는 속도를 나타냅니다. IoT, 소셜 미디어 및 기타 데이터 생성 활동의 성장으로 데이터를 실시간으로 생성하고 수집할 수 있으므로 처리 및 분석이 어렵습니다.
    품질 Veracity 빅데이터의 불확실성, 모호성, 불완전성을 말한다. 빅 데이터의 정확성, 일관성 및 신뢰성을 보장하기 어렵고 데이터를 검증하고 정리하기 위한 새로운 기술이 필요합니다.
    가치 Value 빅데이터에서 얻을 수 있는 인사이트와 지식을 말한다. 빅 데이터의 가치는 비즈니스 운영 및 의사 결정을 개선하는 데 사용할 수 있는 통찰력과 지식을 추출하는 능력에 있습니다.

     

    연관-규칙-학습
    테크닉 - 연관 규칙 학습

     

    빅데이터의 활용

    빅데이터 활용 필요 요소

    자원 대량의 데이터를 저장, 처리 및 분석하는 데 필요한 하드웨어 및 소프트웨어 인프라가 포함됩니다. 여기에는 서버, 저장 장치 및 클라우드 서비스가 포함될 수 있습니다.
    기술 빅 데이터를 관리하고 분석하는 데 필요한 도구와 플랫폼이 포함됩니다. 여기에는 Hadoop 및 NoSQL 데이터베이스와 같은 빅 데이터 관리 플랫폼과 기계 학습 및 예측 모델링과 같은 분석 도구가 포함될 수 있습니다.
    인력 빅 데이터를 수집, 처리 및 분석하는 데 필요한 사람과 기술이 포함됩니다. 여기에는 데이터 과학자, 데이터 엔지니어, 데이터 분석가 및 빅 데이터 작업에 특화된 기타 역할이 포함됩니다.

     

    빅데이터 활용 기술

    • 연관 규칙 학습: 대규모 데이터 세트에서 관계 및 패턴을 발견하는 데 사용되는 기술입니다. 함께 자주 구매하는 품목을 식별하거나 고객 행동의 숨겨진 패턴을 발견하는 데 사용할 수 있습니다.

    • 클러스터링: 유사한 데이터 포인트를 함께 그룹화하는 데 사용되는 기술입니다. 클러스터링은 고객 데이터를 분류하거나, 시장 부문을 식별하거나, 유사한 문서를 함께 그룹화하는 데 사용할 수 있습니다.

    • 유전 알고리즘: 이것은 자연 선택 과정에서 영감을 받은 기술입니다. 복잡한 시스템을 최적화하고 기존 방법으로는 해결하기 어려운 문제에 대한 솔루션을 찾는 데 사용할 수 있습니다.

    • 기계 학습: 모델을 훈련하고 예측하는 데 사용되는 일련의 기술입니다. 기계 학습은 데이터를 분류하고 예측하거나 대규모 데이터 세트에서 패턴과 경향을 식별하는 데 사용할 수 있습니다.

    • 회귀 분석: 종속 변수와 하나 이상의 독립 변수 간의 관계를 분석하는 데 사용되는 통계 기법입니다. 미래 가치를 예측하거나 특정 결과에 영향을 미치는 요소를 식별하는 데 사용할 수 있습니다.

    • 감정 분석: 텍스트에서 주관적인 정보를 식별하고 추출하는 데 사용되는 기술입니다. 트윗, 고객 리뷰 또는 기타 유형의 텍스트 문서의 감정을 결정하는 데 사용할 수 있습니다.

    • 소셜 네트워크 분석: 이것은 사회적 상호 작용 및 관계를 분석하는 데 사용되는 기술입니다. 소셜 네트워크에서 인플루언서, 커뮤니티 및 패턴을 식별하는 데 사용할 수 있습니다.

     


    다음 글

     

    정보의 호텔에는 미래의 데이터 전문가가 되실 분들을 위해 빅데이터분석, 데이터분석에 관한 글을 아래의 페이지에 정리해 놓았습니다. 

     

    '자격증/빅데이터분석기사' 카테고리의 글 목록

    모든 분야의 정보를 담고 있는 정보의 호텔입니다.

    jkcb.tistory.com

    위 페이지는 빅데이터분석기사 / 데이터분석전문가 / 데이터분석준전문가 모두 유용하게 사용하실 수 있습니다.