이 포스팅은 빅데이터분석기사 - 필기 시리즈 10 편 중 2 번째 글 입니다.

  • Part 1 - 01: 빅데이터의 이해
  • Part 2 - This Post
  • Part 3 - 03: 데이터 수집 및 저장 계획
  • Part 4 - 04: 데이터 전처리
  • Part 5 - 05: 데이터 탐색
  • Part 6 - 06: 통계 기법 이해
  • Part 7 - 07: 분석 모형 설계
  • Part 8 - 08: 분석 기법 적용
  • Part 9 - 09: 분석결과 해석 및 활용
  • Part 10 - 10: 분석모형 평가 및 개선
▼ 목록 보기

분석 문제 정의

하향식 (Top down)

문제가 이미 정해져 있는 경우를 말한다.

  1. 문제 탐색
    • BM 기반 문제 탐색
    • 범위 확장(거시적, 경쟁사, 시장, 역량)해서 기회 탐색
    • 외부 참조 벤치마킹
    • 분석 유스케이스 정의
  2. 문제 정의
  3. 해결방안 탐색
  4. 타당성 검토
  5. 선택

상향식 (Bottom up)

디자인적 사고 접근을 사용한다. 일반적인 특징을 관찰하고 문제를 생성하는 방법이다.

대상별 분석 기획 유형

image

  • 최적화
    • 분석 대상도 알아, 어떻게 풀지도 알아. 그럼 최적화 해야지.
  • 솔루션
    • 분석 대상은 알아, 근데 어떻게 풀지 모르겠다. 그럼 풀 방법을 생각해야지.
  • 통찰
    • 분석 대상을 모르겠어. 푸는 방법은 많이 알아. 그럼 문제를 통찰해서 이해해야지.
  • 발견
    • 분석 대상도 모르겠고 푸는 방법도 모르겠다. 발견부터 해보자.

과제 우선 순위 평가

image

  • 시급성(가치)에 중점을 둘 경우
    • 3 -> 4 -> 2
  • 난이도에 중점을 둘 경우
    • 3 -> 1 -> 2

데이터 분석 방안

데이터 유효성

  • 데이터 정확성
    • 정확성
    • 사실성
    • 적합성
    • 필수성
    • 연관성
  • 데이터 일관성
    • 정합성
    • 일치성
    • 무결성

데이터 활용성

  • 데이터 유용성
    • 충분성
    • 유연성
    • 사용성
    • 추적성
  • 데이터 접근성
    • 접근성
  • 데이터 적시성
    • 적시성
  • 데이터 접근성
    • 보호성
    • 책임성
    • 안정성

정규 표현식

  • + - 1개 이상의 문자열 매칭
  • ^ - 시작
  • * - 0개 이상의 문자열 매칭
  • $ - 종료

    분석 절차

image

  1. 분석 기획
    • 비즈니스 이해
    • 프로젝트 정의, 계획
    • 위험 계획 수립
  2. 데이터 준비
    • 필요 데이터 정의
    • 데이터 스토어 설계
    • 데이터 수집 및 정합성 검증
  3. 데이터 분석
    • 분석용 데이터 준비 - 수집된 것 중에서 필요한 것만 빼옴
    • 텍스트 분석
    • 탐색적 분석
    • 모델링
    • 모델 평가 및 검증
    • 모델 적용 및 운영 방안 수립
  4. 시스템 구현
    • 설계 및 구현 - UI, 시스템 구축
    • 시스템 테스트
  5. 평가 및 전개
    • 모델 발전 계획 수립
    • 프로젝트 평가 보고

분석 방법론 유형

  • KDD
    • 프로파일링 기술 기반
    • 데이터 선택
    • 데이터 전처리
    • 데이터 변환
    • 데이터 마이닝
    • 데이터 평가
  • CRISP-DM
    • 유럽연합에서 시작
    • 얘는 이해가 먼저야
    • 업무 이해
    • 데이터 이해
    • 데이터 준비
    • 모델링
    • 평가
    • 전개
  • SEMMA(Sampling Exploration Modification Modeling Assessment)
    • 모델링 전에 수정
    • 샘플링
    • 탐색
    • 수정
    • 모델링
    • 검증

데이터 확보 계획

  1. 목표 정의
  2. 요구사항 도출
  3. 예산안 수립 - 돈이 있어야 하는거다.
  4. 계획 수립

데이터 수집 프로세스

  1. 수집 데이터 도출
  2. 목록 작성
  3. 데이터 소유기간 파악 및 협의 - 일단 되나 확인
  4. 데이터 유형 분류 및 확인
  5. 수집 기술 선정
  6. 수집 계획서 작성 - 서류는 좀 나중에
  7. 수집 주기 결정 - 왜 주기를 그다음에 하는지 모르겠지만 이건 외워
  8. 데이터 수집 실행

빅데이터 요구사항 분석 절차

  1. 요구사항 수집
  2. 요구사항 분석
  3. 요구사항 명세
  4. 요구사항 검증