상세정보
누구나 PYTHON 너도 데이터 가지고 놀 수 있어!
- 저자
- 민형기
- 출판사
- 도서출판 잇플 ITPLE
- 출판일
- 2020-01-08
- 등록일
- 2020-04-14
- 파일포맷
- EPUB
- 파일크기
- 46MB
- 공급사
- 교보문고
- 지원기기
-
PC
PHONE
TABLET
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
이 책은 한 권으로 모든 것을 설명하지 않습니다. 상세한 문법, 언어적 기술은 다른 멋지고 잘 만들어진 책에 맡기고, 우리 책은 난이도별 응용 예제에 집중했다고 생각해 주시면 됩니다.
먼저 설치부터 시작해서, 데이터를 다루는데 필요한 Pandas라는 모듈, 데이터를 시각화하는데 필요한 matplotlib라는 모듈을 다루고, 네이버의 API를 이용해서 데이터를 얻어서 다루는 법을 이야기합니다. 특히 머신 러닝 중에서 상대적으로 간단한 decision tree 기법을 이용해서 아이리스 꽃 분류와 타이타닉 생존자 예측을 수행해 봅니다.
이 책은 하나의 주제를 깊이 있게 다루는 것이 아니라 어쩌면 파이썬이 처음이거나 입문이신 분들을 대상으로 파이썬이 할 수 있는 재미있는 일들을 보여주어 동기를 부여하고 다양한 분야를 체험하는 것이 목표입니다.
저자소개
저자 : 민형기
저자 민형기는
- 국립창원 대학교 공학박사
- 국내 최초 복강경 수술용 로봇 책임연구원
- 로봇 및 인공지능 부분 국가 직무 능력 개발 NCS 학습 모듈 개발 위원
- 로봇/인공지능 분야 블로그 운영
- 파이썬을 활용한 데이터 사이언스 입문 ? 패스트캠퍼스 강의
- AI 로봇관련 분야 연구
목차
01 데이터 데리고 놀기 전 준비하기: 개발 환경 준비
Anaconda 설치 12
Anaconda 환경 설정 19
Python 모듈 설치와 Jupyter Notebook 실행하기 25
Jupyter Notebook 사용법 33
Markdown 문서 이해하기 35
제목 레벨
목록
굵은 글씨, 기울인 글씨, 굵은 상태에서 기울인 글씨
이미지 입력
설치를 마치며 40
02 서울시 청소년 정신건강 분석
데이터 확보하기 42
프로젝트의 목표 49
Pandas - 데이터를 정리하는 필수 도구 51
파이썬에서 모듈 import
pandas DataFrame 구조
정렬 기능 등의 기초 활용 함수
DataFrame의 Slice ? 데이터를 잘라서 선택하기
DataFrame 내에서 조건문 사용
행과 열의 변경
서울시 청소년들의 스트레스 데이터 읽어보기 64
데이터를 정리한 중간 코드 최종 70
데이터를 시각적으로 표현하기 - matplotlib 기초 71
간단하게 그리기
matplotlib의 한글 문제
데이터를 그래프로 표현하기 78
03운동량 데이터 분석해 보기
파이썬의 기본 데이터 구조인 list형 82
데이터를 저장하고 읽기 86
데이터를 정리하는 마법 같은 단어 pivot_table 91
‘운동을 하지 않는 이유’에 대한 데이터 분석 94
04인터넷에서 데이터를 얻어서 엑셀로 정리해 보기
Naver 개발자 센터에서 애플리케이션 등록 104
네이버 API 간단히 사용해 보기 110
파이썬의 반복문 113
함수의 사용 115
네이버 책 검색에서 정보 가져오기 116
엑셀에 저장하기 125
05얼굴인식 등의 이미지 관련 API 사용
네이버 얼굴인식 기능 128
파이썬 dict형 데이터와 json 133
인식된 얼굴 사진에 정보 표시하기 135
여러 얼굴이 있는 사진에 대한 정보 표시하기 139
06우리도 인공지능을 배워볼까요 IRIS 꽃 분류하기
Iris 꽃 데이터 143
seaborn의 pairplot으로 iris 데이터 확인하기 147
간단한 결정나무 모델 152
학습한 모델 사용하기 160
07타이타닉 생존자 예측하기
데이터 읽고 전체 상황 확인하기 164
데이터 개요를 그래프로 확인하기 167
나이별 구별 및 성별 생존율 확인하기 171
보트 탑승 승객의 생존율 확인하기 174
귀족들의 생존율만 다시 조사하기 176
학습을 위한 데이터 정리와 특징 선택하기 180
생존자 예측을 위한 모델 수립 184
생존자 예측; 디카프리오는 정말 생존할 수 없었을까? 188
08레드 와인, 화이트 와인 분류하기
데이터 받기 193
학습용 데이터 만들기 194
로지스틱 회기로 학습하기 195
데이터 정규화 197
결정나무를 이용한 분류 201