Study/Data Analysis
-
혼자 공부하는 데이터 분석 CH 07 통계와 머신러닝Study/Data Analysis 2025. 9. 27. 11:54
목차 들어가며: 데이터 인사이트를 찾는 두 축, 통계적 추론과 머신러닝 예측. 1. 통계적으로 추론하기: 데이터 뒤에 숨겨진 진실 찾기 1-1. 중심극한정리: 통계적 추론의 기본 원리 1-2. 신뢰구간 추정: 모집단 평균의 예상 범위 설정 1-3. 가설검정 (T-검정): 두 그룹 차이의 유의성 판단 1-4. 순열검정: 비모수적 가설 검정의 강력한 대안) 2. 머신러닝으로 예측하기: 미래를 설계하는 모델 만들기 2-1. 선형 회귀: 연속적인 값 예측 2-2. 로지스틱 회귀: 범주형 결과 분류 예측 2-3. 모델 평가 지표: 성능의 객관적 측정 2-4. 모델 성능 해석: 지표를 통한 개선 방향 설정) 마치며: 데이터 분석 능력 향상을 위한 실습의 중요성. 들어가며: 데이터 인사이트를 찾는 두 축,..
-
혼자 공부하는 데이터 분석 CH 06 복잡한 데이터 표현하기Study/Data Analysis 2025. 9. 26. 10:46
목차들어가며: Matplotlib 그래프, 더 자유롭게 다루기그래프 꾸미기의 시작: 객체지향 API2-1. Pyplot 방식 vs 객체지향 API 방식2-2. 한글 폰트 설정하기데이터 시각화 실전: 산점도 개선하기3-1. 기본 산점도 그리기3-2. 마커 크기와 색상으로 정보 추가하기3-3. 컬러바(Colorbar) 활용하기Matplotlib 고급 기능 활용4-1. 하나의 Figure에 여러 그래프 그리기 (선, 막대)4-2. 누적 정보를 보여주는 스택 그래프 (영역, 막대)4-3. 비율을 보여주는 원 그래프 (파이 차트)4-4. 서브플롯으로 여러 그래프 한 번에 배치하기더 간편한 시각화: Pandas 플롯 기능마치며: 데이터의 스토리를 만드는 시각화 기술 들어가며: Matplotlib 그래프, 더 자유롭..
-
혼자 공부하는 데이터 분석 CH 05 데이터 시각화Study/Data Analysis 2025. 9. 25. 10:37
목차들어가며맷플롯립 기본 요소 알아보기Figure 클래스rcParams 객체여러 개의 서브플롯 출력하기선, 막대 그래프 그리기데이터 준비: 연도별/주제별 도서 개수 구하기선 그래프 그리기막대 그래프 그리기이미지 출력하고 저장하기마치며 1. 들어가며데이터 분석에서 시각화는 데이터의 특징과 패턴을 직관적으로 파악하는 데 매우 중요한 역할을 합니다.파이썬의 대표적인 시각화 라이브러리인 맷플롯립(Matplotlib)은 다양한 종류의 그래프를 만들 수 있는 강력한 도구입니다.이번 포스팅에서는 맷플롯립의 기본적인 구성 요소를 알아보고, 이를 활용하여 선 그래프와 막대 그래프를 그리는 방법에 대해 자세히 살펴보겠습니다. 2. 맷플롯립 기본 요소 알아보기맷플롯립으로 그래프를 그리기 전에 기본적인 구성 요소인 Fig..
-
혼자 공부하는 데이터 분석 CH 04 통계와 분포Study/Data Analysis 2025. 9. 24. 11:27
목차들어가며통계로 요약하기데이터 로드 및 기본 확인기술통계 구하기평균 (Mean)중앙값 (Median)최솟값과 최댓값분위수 (Quantile)분산 (Variance)표준편차 (Standard Deviation)최빈값 (Mode)데이터프레임 전체 통계NumPy 통계 함수들실전 문제 해결핵심 개념 정리분포 요약하기데이터 로드 및 준비산점도 그리기히스토그램 그리기상자 수염 그림 (Box Plot)판다스의 그래프 함수들실전 문제 해결핵심 개념 정리마치며 들어가며데이터 분석의 첫걸음은 주어진 데이터를 제대로 이해하는 것에서 시작합니다. 방대한 양의 데이터를 한눈에 파악하기란 쉽지 않지만, 통계적인 방법을 사용하면 데이터의 중심 경향성, 퍼진 정도 등 핵심적인 특징을 몇 개의 숫자로 요약할 수 있습니다. 또한, 시..
-
혼자 공부하는 데이터 분석 CH 03 데이터 클렌징Study/Data Analysis 2025. 9. 23. 11:32
목차들어가며: 야생의 데이터를 길들이다, 판다스 데이터 클렌징 1. 불필요한 데이터 삭제하기 (데이터 클렌징의 첫걸음) 1-1. 데이터 로드 및 초기 확인1-2. 열(컬럼) 삭제: 데이터의 군살 빼기1-3. 행(로우) 삭제: 조건에 맞는 데이터만 남기기1-4. 중복된 행 처리: 데이터의 신뢰성 높이기1-5. 전처리 과정 함수화: 재사용성을 위한 지혜 2. 잘못된 데이터 수정하기 (데이터의 품질 향상) 2-1. 데이터프레임 정보 확인 및 NaN 처리2-2. 정규 표현식을 이용한 데이터 정제2-3. 이상치(Outlier) 처리: 현실적인 데이터 만들기2-4. 웹 스크래핑으로 누락 정보 채우기 (데이터 인리치먼트)2-5. 최종 정제 및 함수화 마치며: 깨끗한 데이터, 성공적인 분석의 초석들어가며: 야생의 데이..
-
혼자 공부하는 데이터 분석 CH 02 웹 스크래핑Study/Data Analysis 2025. 9. 22. 10:53
목차 들어가며: API, JSON, XML, 그리고 웹 스크래핑으로 데이터 정복하기 1. API와 데이터 형식 (JSON, XML) 다루기1-1. JSON 데이터 처리1-2. XML 데이터 처리1-3. API 호출 및 응답 처리2. 웹 스크래핑으로 웹 데이터 가져오기2-1. 데이터 로드 및 전처리2-2. 웹 스크래핑 기초 (requests & BeautifulSoup)2-3. 스크래핑 함수화 및 데이터프레임 병합마치며: 데이터 수집과 가공, 그 다음은? 들어가며: API, JSON, XML, 그리고 웹 스크래핑으로 데이터 정복하기안녕하세요! 데이터 분석의 핵심은 바로 '데이터'를 얻는 것입니다.오늘은 웹에 흩어져 있거나 API를 통해 제공되는 다양한 형태의 데이터를 파이썬으로 가져오고 다루는 방법을 깊..
-
혼자 공부하는 데이터 분석 CH 01 데이터 분석Study/Data Analysis 2025. 9. 21. 17:06
목차데이터 분석가와 데이터 과학자, 무엇이 다를까요?실전 데이터 분석: 공공 도서 대출 목록 전처리 과정마치며1. 데이터 분석가와 데이터 과학자, 무엇이 다를까요?최근 몇 년간 '데이터'의 중요성이 부각되면서 '데이터 분석가'와 '데이터 과학자'라는 직업이 큰 주목을 받고 있습니다.두 직무 모두 데이터를 다루지만, 요구되는 역량과 수행하는 역할에는 미묘한 차이가 있습니다.오늘 이 두 가지 개념을 명확히 정리하고, 실제 데이터 전처리 과정을 함께 살펴보겠습니다. 1-1. 데이터 분석가, 어떤 역량이 필요할까? 데이터 분석가는 데이터를 기반으로 현상을 이해하고, 문제를 진단하며, 실질적인 비즈니스 의사결정에 도움을 주는 역할을 합니다.이를 위해서는 아래의 세 가지 핵심 역량이 조화를 이루어야 합니다.프로그..