본문 바로가기

728x90
반응형

온라인 강의 내용/패캠-데이터분석

(4)
4. 데이터분석과 엑셀 : MATCH, INDEX, 날짜함수, 텍스트함수, 텍스트나누기, 중복항목 제거 MATCH 함수 내가 찾고 싶은 값이 한 행/열에서 몇 번째에 있는지를 숫자로 알려준다 INDEX 함수 특정 범위에서 행 번호와 열 번호로 원하는 데이터를 불러온다. MATCH & INDEX 함수 조합으로 사용 DAYS / DATEIF 함수 DATEIF에서 3번째 항목 D: 일수 / M : 월수 / Y : 연수 / YM : 올해의 월수 / MD : 이번달의 일수 * 만약 종료일을 기간에 포함시켜야 한다면? 기간을 구하는 수식에 +1을 한다 YEAR / MONTH / DAY : 연월일 데이터의 경우 각각 연/월/일만 추출해야 한다면 =YEAR(D3) > 2033 =MONTH(D3) > 11 =DAY(D3) > 8 FIND 함수 긴 텍스트에서 특정 단어나 문장이 시작되는 위치를 숫자로 출력 띄어쓰기까지 포함..
3. 데이터분석과 엑셀 : 데이터 전처리 , IF, VLOOKUP 데이터 전(前)처리 데이터의 분석 목적과 방법에 맞게 데이터를 가공 또는 처리하는 과정 데이터 및 변수 형태 변환 변수선정 결측치 및 이상치 처리 데이터 분류 (카테고리) 데이터 분리 및 결합 기타 데이터 가공 및 처리 데이터 분석 과정 중 가장 많은 시간과 비용이 필요한 과정 (60~80%) IF 함수와 중첩 부등호/등호 (>, IF 함수를 N번 중첩 사용하면 데이터가 N+1가지로 구분 값을 직접 넣을수도 있으나, 엑셀의 셀을 참조하는 방식으로 사용할 수 도 =IF(E5>=N5, M5, IF(E5>=N6, M6, M7)) 기준 연령에 맞춰서, 구분을 표시하도록 =IF(E5>=$N$5, $M$5, IF(E5>=$N$6, $M$6, $M$7)) 데이터 참조할 건 절대참조 (구분 & 기준연령) 인원수를 구할..
2. 데이터분석과 엑셀 : 탐색적 데이터 분석 (EDA) 탐색적 데이터 분석 (EDA, Exploratory Data Analysis) 기존 통계학이 정보 추출에서 가설 검정 등에 치우치다 보니, 자료 본연의 의미를 찾는데 어려움이 존재함. 이를 보완하고자 주어진 자료만 가지고도 충분한 정보를 찾을 수 있도록하는 여러 탐색적 자료 분석 방법. 내 입맛대로 수집되는 데이터는 1도 없다 데이터의 분포를 파악할 수 있다 분석에 필요한 데이터 전처리를 수행할 수 있다 데이터의 생김새를 알아야 올바른 분석을 할 수 있다 결측치, 이상치를 파악하고 처리할 수 있다 가장 적합한 분석 방법을 결정할 수 있다 - 결측: 계획된 실험 배치에서 어떤 사고로 이루어지지 못한 관측 기초 통계량 계산 * 합계=SUM(범위) * 중앙값=MEDIAN(범위). 자료를 크기 순서로 나열해 놓..
1. 데이터분석과 엑셀 : 데이터 분석 개념 , 엑셀의 참조 ※ 데이터 분석. Data Analysis 유용한 정보를 발굴하고 결론 내용을 알리며 의사결정을 지원하는 것을 목표로 데이터를 정리, 변환, 모델링하는 과정. 의사결정을 더 과학적으로 만들어주고 비즈니스를 더 효율적으로 운영할 수 있도록 도와주는 역할을 한다. ※ 데이터 분석의 개념과 과정 과거 데이터를 분석해서 현실 상황 반영. 단, 현실과 이상의 GAP을 고려해야 한다. 문제를 해결하고 개선할 수 있는 인사이트를 도출해야 한다. 데이터 수집 : 업무상황에서 발생하는 다양한 데이터 수집 데이터 전처리 : 분석목적 및 방법에 부합하도록 데이터의 내용, 형태 가공 데이터 모델링 : 결과도출을 위한 수식/함수/기능 적용. 의사결정나무, 랜덤포레스트, 인공신경망 검증 및 평가 : 개선효과계산. 과거데이터와 비..

반응형