다양한 데이터 분석 활용 방법과 파이썬 예제를 이용한 데이터 처리와 분석 노하우!
데이터 분석에 대한 이론적인 내용과 실제 적용 사례를 함께 다루고 있어서 누구나 쉽게 데이터 분석을 이해하고 활용할 수 있도록 구성되었습니다. 다양한 분야에서 데이터 분석을 활용하는 방법과 더 나은 의사 결정을 위한 데이터 분석 기술도 함께 소개하며, 독자들이 깊이 있는 데이터 분석을 학습할 수 있습니다. 다양한 예제를 통해 데이터 분석을 마스터하세요.
<첫째 마당> 데이터 분석 개요
1장 | 데이터 분석 개요
1-1 데이터 분석 이해
데이터 분석 정의
데이터 분석 필요성
1-2 데이터 분석 활용 분야
국외 활용 사례
국내 활용 사례
1-3 데이터 분석 도구
데이터 분석 도구 종류
데이터 분석 도구로써의 파이썬
1-4 데이터 분석 처리 과정
문제 해결의 목적 정의
데이터 수집
데이터 전처리와 정형화
데이터 탐색과 분석
활용을 위한 공유 및 평가
<둘째 마당> 파이썬 기초
2장 | 데이터 분석을 위한 실습 환경
2-1 파이썬 IDLE
파이썬 IDLE 기본 사용법
2-2 주피터 노트북
주피터 노트북 기본 사용법
2-3 구글 코랩
구글 코랩 기본 사용법
3장 | 데이터 분석을 위한 파이썬 핵심 문법
3-1 변수
변수의 개념
변수의 특징
변수를 사용하는 이유
변수 생성 및 규칙
다양한 타입의 변수
3-2 연산자
산술 연산자
대입 연산자
비교 연산자
논리 연산자
문자열 연산자
3-3 표준 입력과 출력
표준 입력
표준 출력
3-4 컬렉션 자료형
컬렉션 자료형 개념과 필요성
리스트 자료형
튜플 자료형
딕셔너리 자료형
세트(set) 자료형
3-5 리스트 내포
리스트 내포 처리 과정
3-6 선택문
파이썬 선택문 개요
if/if~else 문
if~elif/if~elif~else 문
3-7 반복문과 기타 제어문
파이썬 반복문 개요
for 문
while 문
기타 제어문
중첩 반복문
3-8 함수
함수란?
사용자 정의 함수
람다 함수
3-9 파일 입·출력
파일 입·출력 기본
세션 저장소에 업로드
텍스트 파일 읽고 쓰기
파일 오류 처리
엑셀 파일 읽고 쓰기
<셋째 마당> 데이터 분석 라이브러리
4장 | 수치 연산이 쉬운 넘파이
4-1 넘파이 배열의 개념 및 특징
4-2 넘파이 배열 생성
리스트로 배열 생성하기
배열 생성 및 초기화
생성한 값으로 배열 생성
난수 기반으로 배열 생성하기
4-3 넘파이 배열 조회
넘파이 표준 데이터 타입
넘파이 배열 속성 정보
배열의 인덱싱
배열의 슬라이싱
논리 인덱싱
4-4 배열의 연산
배열의 일반 연산
브로드캐스팅 연산
백터 연산
4-5 배열 변환
전치
배열 형태 변경
배열 요소 추가 및 삭제
배열 결합
배열 분리
5장 | 데이터 처리가 쉬운 판다스
5-1 판다스 개념 및 특징
5-2 판다스 객체 생성
Series와 DataFrame
Series 만들기
DataFrame 만들기
csv 활용하기
5-3 판다스 데이터 확인하기
5-4 판다스 데이터 선택하기
5-5 판다스 결측데이터 처리하기
5-6 판다스 데이터 가공하기
5-7 판다스 데이터 그룹핑하기
6장 | 판다스 활용
6-1 붓꽃 데이터 분석하기
데이터 읽어 와서 확인하기
데이터 전처리
데이터 그룹핑하기
판다스의 데이터 시각화
6-2 타이타닉 데이터 분석하기
데이터 읽어와서 확인하기
데이터 전처리
데이터 그룹핑하기
판다스의 데이터 시각화
7장 | 시각화 라이브러리
데이터 시각화 장점
7-1 데이터 시각화 이해
데이터 시각화 활용 사례
파이썬으로 하는 데이터 시각화
시각화 옵션
7-2 맷플롯립 라이브러리
선 그래프
막대 그래프
산점도 그래프
히스토그램 그래프
상자수염 그래프
7-3 시본 라이브러리
데이터 시각화 준비하기
시본 막대 그래프
시본 산점도 그래프
시본 히스토그램
시본 상자수염 그래프
카운트 플롯 그래프
바이올린 플롯 그래프
시본 히트맵 그래프
다중 플롯 그리드 그래프
<넷째 마당> 데이터 분석 미니 프로젝트
8장 | 환경 관련 데이터 분석하기
8-1 분석 대상 데이터 수집
에어코리아 사이트에서 미세먼지 데이터 수집
기상청 사이트에서 날씨 데이터 수집
구글 코랩에 업로드하기
8-2 데이터 확인하기
미세먼지 데이터
날씨 데이터
8-3 데이터 병합하기
8-4 데이터 분석 및 시각화
데이터 분석
데이터 시각화
9장 | 행복지수 데이터 분석하기
9-1 분석 대상 데이터 수집
대한민국 행복지도 사이트에서 수집
세션 저장소에 업로드
9-2 데이터 가공
데이터 읽어와서 확인하기
데이터 병합하기
데이터 검산하기
9-3 데이터 분석 및 시각화
데이터 분석
한글 폰트 설정
선 그래프로 시각화
막대 그래프로 시각화
히트맵 그래프로 시각화
10장 | 병원 노쇼 환자 데이터 분석하기
10-1 데이터 전처리의 이해
데이터 전처리가 필요한 이유
데이터 전처리 방법
10-2 병원 노쇼 환자 데이터 분석 실습 (1)
문제 정의와 변수 설명
데이터 읽기와 확인
결측치 확인하기
통계량을 이용하여 이상치 제거하기
데이터 타입 변환
새로운 변수 추가
값 확인하여 이상치 제거하기
목적에 적합한 변수 추출
노쇼의 특징 파악 정리
10-3 병원 노쇼 환자 데이터 분석 실습 (2)
11장 | 주식 시세 예측 분석하기
11-1 시계열 데이터의 이해
시계열 데이터 패턴
시계열 데이터 분석의 이해
시계열 데이터 전처리 방법
11-2 시계열 데이터 전처리 실습
문제 정의와 변수 설명
주식 관련 라이브러리 설치하기
애플 주식 데이터 가져오기
주식 가격 시각화하기
시계열 데이터 전처리 및 데이터 확인
11-3 시계열 데이터 예측 분석
ARIMA 모델 만들기
모델을 이용하여 예측하기
예측 결과 시각화하기
12장 | 영화 리뷰 시각화하기
12-1 자연어
단어 토큰화
토큰화 실습
12-2 워드클라우드
라이브러리 설치하기
한글 글꼴 설치
텍스트 가져와서 품사 태깅하기
동일한 단어의 빈도수 구하기
워드클라우드 생성
맷플롯립으로 시각화하기
12-3 자연어 처리 실습 (1)
영화 리뷰 자연어 처리 (1)
12-4 자연어 처리 실습 (2)
영화 리뷰 자연어 처리 (2)
13장 | 대학생 정신 건강 데이터 분석하기
13-1 문제 정의와 데이터 살펴보기
데이터 읽기와 필요한 라이브러리 불러오기
13-2 데이터 전처리
속성 탐색과 전처리
데이터 시각화
상관 관계 분석하기
ㆍ지은이 오경선
ㆍ지은이 양숙희
ㆍ지은이 장은실
독자의견 남기기