데이터 분석 과정

2024. 7. 13. 15:01통계 및 분석

반응형

안녕하세요? 분석하는 디제이입니다.

 

데이터 분석에 대해 뭔가 체계적으로 글을 써보고 싶었는데 설명하고 싶은건 많고, 

 

체계적으로 정리해서 한 번에 딱 쉽게 설명하고 싶어 욕심을 부리다가 이도저도 안되고 시간만 속절없이 흘러가서

 

뭐라도 쓰고보기로 했습니다.

 

오늘은 첫번째로 데이터 분석하면서 가장 큰 기본 틀. 데이터 분석 과정이 어떻게 되는지부터 설명드리고자 합니다.

 

그럼 가시죠!

 


데이터 분석은 크게 다음 5단계로 나눌 수 있을 것 같습니다.

 

1. 데이터 불러오기

2. 데이터 정리하기

3. 데이터 탐색하기

4. 데이터 분석하기

5. 데이터 표현하기

 

각 과정에 대해 좀 더 설명하자면

1. 데이터 불러오기

- xlsx, txt, csv 등 파일로 저장된 데이터를 불러오거나, API를 활용하여 데이터를 직접 불러오는 등 

  말 그대로 데이터를 분석하기 위해 분석 프로그램에 데이터를 불러오기 위한 과정을 의미합니다.

 

2. 데이터 정리하기

 - 데이터에는 수많은 행과 컬럼이 있는데요, 이 중에서 우리가 원하는 조건에 따라 데이터를 빼고, 더하고,

   새로운 컬럼을 만들고, 합치는 등의 과정을 의미합니다.

 

3. 데이터 탐색하기

 - 분석하기에 앞서 데이터의 요약통계량, 분포 등을 보면서 어떤 분석법을 사용하면 좋을지 보기도 하고, 

   이상치, 결측치 등을 처리하면서 데이터를 살펴보고 분석에 적합하게 데이터를 바꾸는 과정을 의미합니다.

 

4. 데이터 분석하기

 - 분류, 예측 등 분석가가 최적의 분석법을 활용하여 원하는 문제를 분석하는 과정을 의미합니다.

 

5. 데이터 표현하기

 - 분석한 결과를 전문가 · 비전문가들에게 설명하고 이해시키기위해  요약하고 그래프로 예쁘게 표현하는 과정을 의미합니다.

 

데이터 분석은 크게 위 5가지 과정으로 설명할 수 있습니다.

각 과정마다 정말 다양한 것들이 있지만 크게는 이렇게 볼 수 있을 것 같구요.

앞으로 각 과정에 속한 세부 내용들에 대해 글을 하나씩 작성해서 올려보겠습니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형

'통계 및 분석' 카테고리의 다른 글

계층적 군집분석  (0) 2024.08.15
회귀모형 변수 선택법 5가지  (0) 2024.03.25