python DA

본 문서는 [파이썬 라이브러리를 활용한 데이터 분석] 책을 기반으로 하고 있으며, subinium(본인)이 정리하고 추가한 내용입니다. 생략된 부분과 추가된 부분이 있으니 추가/수정하면 좋을 것 같은 부분은 댓글로 이야기해주시면 감사하겠습니다.

영문본 pdf는 다음과 같습니다.

목차는 다음과 같습니다.

  • CHAPTER 1 시작하기 전에
  • CHAPTER 2 사례 소개
  • CHAPTER 3 IPython 소개
    • 3.1 IPython 기본
    • 3.2 명령어 히스토리 사용하기
    • 3.3 운영체제와 함께 사용하기
    • 3.4 소프트웨어 개발 도구
    • 3.5 IPython HTML 노트북
    • 3.6 IPython을 사용한 제품 개발을 위한 팁
    • 3.7 IPython 고급 기능
  • CHAPTER 4 NumPy 기본: 배열과 벡터 계산
    • 4.1 NumPy ndarray:다차원 배열 객체
    • 4.2 유니버설 함수
    • 4.3 배열을 사용한 데이터 처리
    • 4.4 배열의 파일 입출력
    • 4.5 선형대수
    • 4.6 난수 생성
    • 4.7 계단 오르내리기 예제
  • CHAPTER 5 pandas 시작하기
    • 5.1 pandas 자료 구조 소개
    • 5.2 핵심 기능
    • 5.3 기술통계 계산과 요약
    • 5.4 누락된 데이터 처리하기
    • 5.5 계층적 색인
    • 5.6 pandas와 관련된 기타 주제
  • CHAPTER 6 데이터 로딩, 저장, 파일 형식
    • 6.1 텍스트 파일 이용하는 방법
    • 6.2 이진 데이터 형식
    • 6.3 HTML, 웹 API와 함께 사용하기
    • 6.4 데이터베이스와 함께 사용하기
  • CHAPTER 7 데이터 준비하기: 다듬기, 변형, 병합
    • 7.1 데이터 합치기
    • 7.2 재형성과 피벗
    • 7.4 문자열 다루기
    • 7.5 예제: 미국 농무부 음식 데이터베이스
  • CHAPTER 8 도식화와 시각화
    • 8.1 matplotlib API 간략하게 살펴보기
    • 8.2 pandas에서 그래프 그리기
    • 8.3 지도 그리기: 아이티 지진 데이터 시각화하기
    • 8.4 파이썬 시각화 도구 생태계
  • CHAPTER 9 데이터 수집과 그룹 연산
    • 9.1 GroupBy 메카닉
    • 9.2 데이터 수집
    • 9.3 그룹별 연산과 변형
    • 9.4 피벗 테이블과 교차일람표
    • 9.5 예제: 2012년 연방 선거관리위원회 데이터베이스
  • CHAPTER 10 시계열
    • 10.1 날짜, 시간 자료형, 도구
    • 10.2 시계열 기초
    • 10.3 날짜 범위, 빈도, 이동
    • 10.4 시간대 다루기
    • 10.5 기간과 기간 연산
    • 10.6 리샘플링과 빈도 변환
    • 10.7 시계열 그래프
    • 10.8 이동창 기능
    • 10.9 성능과 메모리 사용량에 대한 노트
  • CHAPTER 11 금융, 경제 데이터 애플리케이션
  • CHAPTER 12 고급 NumPy
    • 12.1 ndarray 객체 내부 알아보기
    • 12.2 고급 배열 조작 기법
    • 12.3 브로드캐스팅
    • 12.4 고급 ufunc 사용법
    • 12.5 구조화된 배열과 레코드 배열
    • 12.6 정렬에 관하여
    • 12.7 NumPy matrix 클래스
    • 12.8 고급 배열 입출력
    • 12.9 성능 팁

이 책의 경우에는 1, 2, 11장을 제외하고 정리를 진행하며, 업로드 순서가 비교적 랜덤할 수 있습니다.

Leave a Comment