본 문서는 [파이썬 라이브러리를 활용한 데이터 분석] 책을 기반으로 하고 있으며, subinium(본인)이 정리하고 추가한 내용입니다. 생략된 부분과 추가된 부분이 있으니 추가/수정하면 좋을 것 같은 부분은 댓글로 이야기해주시면 감사하겠습니다.
영문본 pdf는 다음과 같습니다.
목차는 다음과 같습니다.
CHAPTER 1 시작하기 전에CHAPTER 2 사례 소개- CHAPTER 3 IPython 소개
- 3.1 IPython 기본
- 3.2 명령어 히스토리 사용하기
- 3.3 운영체제와 함께 사용하기
- 3.4 소프트웨어 개발 도구
- 3.5 IPython HTML 노트북
- 3.6 IPython을 사용한 제품 개발을 위한 팁
- 3.7 IPython 고급 기능
- CHAPTER 4 NumPy 기본: 배열과 벡터 계산
- 4.1 NumPy ndarray:다차원 배열 객체
- 4.2 유니버설 함수
- 4.3 배열을 사용한 데이터 처리
- 4.4 배열의 파일 입출력
- 4.5 선형대수
- 4.6 난수 생성
- 4.7 계단 오르내리기 예제
- CHAPTER 5 pandas 시작하기
- 5.1 pandas 자료 구조 소개
- 5.2 핵심 기능
- 5.3 기술통계 계산과 요약
- 5.4 누락된 데이터 처리하기
- 5.5 계층적 색인
- 5.6 pandas와 관련된 기타 주제
- CHAPTER 6 데이터 로딩, 저장, 파일 형식
- 6.1 텍스트 파일 이용하는 방법
- 6.2 이진 데이터 형식
- 6.3 HTML, 웹 API와 함께 사용하기
- 6.4 데이터베이스와 함께 사용하기
- CHAPTER 7 데이터 준비하기: 다듬기, 변형, 병합
- 7.1 데이터 합치기
- 7.2 재형성과 피벗
- 7.4 문자열 다루기
- 7.5 예제: 미국 농무부 음식 데이터베이스
- CHAPTER 8 도식화와 시각화
- 8.1 matplotlib API 간략하게 살펴보기
- 8.2 pandas에서 그래프 그리기
- 8.3 지도 그리기: 아이티 지진 데이터 시각화하기
- 8.4 파이썬 시각화 도구 생태계
- CHAPTER 9 데이터 수집과 그룹 연산
- 9.1 GroupBy 메카닉
- 9.2 데이터 수집
- 9.3 그룹별 연산과 변형
- 9.4 피벗 테이블과 교차일람표
- 9.5 예제: 2012년 연방 선거관리위원회 데이터베이스
- CHAPTER 10 시계열
- 10.1 날짜, 시간 자료형, 도구
- 10.2 시계열 기초
- 10.3 날짜 범위, 빈도, 이동
- 10.4 시간대 다루기
- 10.5 기간과 기간 연산
- 10.6 리샘플링과 빈도 변환
- 10.7 시계열 그래프
- 10.8 이동창 기능
- 10.9 성능과 메모리 사용량에 대한 노트
CHAPTER 11 금융, 경제 데이터 애플리케이션- CHAPTER 12 고급 NumPy
- 12.1 ndarray 객체 내부 알아보기
- 12.2 고급 배열 조작 기법
- 12.3 브로드캐스팅
- 12.4 고급 ufunc 사용법
- 12.5 구조화된 배열과 레코드 배열
- 12.6 정렬에 관하여
- 12.7 NumPy matrix 클래스
- 12.8 고급 배열 입출력
- 12.9 성능 팁
이 책의 경우에는 1, 2, 11장을 제외하고 정리를 진행하며, 업로드 순서가 비교적 랜덤할 수 있습니다.
Leave a Comment