책소개
누구도 말해 주지 않았던 데이터 과학자의 실무
오바마 대선 승리의 숨은 공신이자 9?11 테러범을 찾는 데 결정적 기여를 한 것은 액시엄(Acxiom)의 데이터였다! 미국 최대 데이터 회사, 액시엄에서 근무했던 한국인 데이터 과학자가 미국 기업과 한국 기업에서 경험한 데이터 과학 실무 사례를 최초로 공개했다. 데이터 과학이란 무엇이며 보이지 않는 곳에서 데이터 과학자는 어떤 일을 하고 있는지, 미국 제너럴 모터스부터 한국의 대기업(통신, 금융, 보안, 유통, 제조)까지! 국내외 주요 산업 분야의 실무 케이스로 데이터 경제 시대를 준비하자.
목차
프롤로그 데이터 과학자가 되기까지
첫째마당 데이터 과학과 데이터 과학자
01 데이터 과학과 데이터 과학자
데이터 과학과 빅데이터
데이터 과학과 데이터의 크기
데이터를 분석하는 다양한 직업들, 직책만 4,900개
데이터 분석가와 데이터 과학자는 어떻게 다른가
데이터 과학의 높아진 위상, 최고 데이터 책임자(CDO)
데이터 과학자, 무엇을 배우고 공부해야 하는가
중요한 것은 현장에서의 경험이다
데이터 과학자는 데이터 품질 전문가가 되어야 한다
다양한 플랫폼 환경과 마주하게 되는 데이터 과학자
데이터 과학자의 다양한 분석 도구들
발전하는 분석 알고리즘
데이터 과학자는 알고리즘 사용자이지 개발자가 아니다
데이터 과학자가 갖추어야 할 소양
02 데이터 과학과 빅데이터 플랫폼
빅데이터 활용, 구체적인 계획과 전략이 먼저다
빅데이터 플랫폼, 설계 단계부터 첫 단추를 잘 끼워야 한다
빅데이터 플랫폼, 하둡이 만병통치약은 아니다
03 성공적인 데이터 활용
한국의 데이터 활용 수준은 5단계 중 3단계에서 4단계로 넘어가는 단계!
성공적인 데이터 활용 전략 세우기 1: 기업의 분석 경쟁력 파악하기
성공적인 데이터 활용 전략 세우기 2: 전략적 로드맵 수립하기
성공적인 데이터 활용 전략 세우기 3: 분석할 주제 선정하기
데이터 과학, 성공적 활용의 비밀은 클로즈 루프 프로세스!
데이터 중심의 경영과 조직 문화가 우선되어야 한다
둘째마당 미국 기업들의 데이터 과학 활용 사례
04 미국 최대의 데이터 회사, 액시엄
데이터, 왜 가공이 중요한가
미국 최대의 데이터 전문 기업, 액시엄
액시엄의 가공 데이터, 어떤 것들이 있나?
액시엄 데이터 활용
컨설팅 조직, 어떻게 구성되나?
액시엄의 가공 데이터, 정확도 떨어져도 가치 있는 정보로 변신한다
액시엄 소비자 데이터, 모호함을 없애고 처리 과정을 투명하게!
05 GM 온스타
GM 온스타, 정제된 고객 데이터에 기초한 텔레매틱스 서비스
온스타 데이터와 액시엄이 만나다
액시엄의 고객 데이터 정제 과정 살펴보기
액시엄의 데이터 정제 소프트웨어 살펴보기
마침내 사람들이 온스타 서비스를 사기 시작했다
06 미국 대형 자동차 판매 딜러
액시엄, 자동차 딜러들의 영업을 지원하는 마케팅 분석 모델을 개발하다
데이터 분석 알고리즘 개발 과정 1: 자동차 모델 세분화하기
데이터 분석 알고리즘 개발 과정 2: 구매자 성향 파악하기
데이터 분석 알고리즘 개발 과정 3: 적정 구매 시기와 구매력 파악하기
07 뱅크 오브 아메리카
뱅크 오브 아메리카 프로젝트, 금융 성과 분석 보고서와 고객 관리 모델을 만들다
뱅크 오브 아메리카의 데이터센터, 슬림화와 효율성에 도전하다
금융 성과 보고서, 과거 추이를 분석해 현재 성과를 평가하고 미래 전략을 시사한다
신용카드 고객 이탈 모델, 고객 이탈률을 줄이고 마케팅 캠페인의 효과를 높인다
이탈 모델 개발, 어떻게 이루어지나?
카드 연체 가능 고객 세분화, 마이크로 타기팅으로 마케팅 비용을 최적화한다
신용카드 예비 신규 고객 선정, 고객 반응률을 높여
투자 대비 수익률을 높인다
08 메트라이프
메트라이프 프로젝트, 전사 데이터 웨어하우스와 BI 툴 구축을 지원하다
BI 1.0에서 BI 3.0으로 발전하다
전사 데이터 웨어하우스, 전사적 전략적 인사이트를 제공한다
전사 데이터 통합 프로세스의 출발은 데이터 변수 선정과 품질 확인
전사 데이터 통합 과정에 뒤따르는 조직 갈등과 재구성
메트라이프의 빅데이터 활용 사례 3가지
데이터 중심의 기업 조직과 문화가 경쟁력이다
09 넷플릭스
넷플릭스 분석 경연대회, 분석 모델의 예측력을 높여라
우승팀은 어떤 알고리즘을 사용해 예측력을 높일 수 있었나?
기계학습에 대하여
10억짜리 알고리즘, 현업 적용에 실패한 이유는?
넷플릭스 빅데이터 운영본부, 엄청난 양의 빅데이터를 문제 없이 처리하는 비결은?
셋째마당 한국의 데이터 활용 사례
10 전사 통합 CRM 전략
과거 CRM 실패 요인은 빅데이터 활용의 실패 원인이 될 수 있다
데이터 활용 중장기 전략, 왜 필요한가
전사적 통합 CRM 전략, 중앙집중적 조직 구조일 때 최적의 성과를 낸다
고객 접촉 이력 관리는 필수!
마케팅 캠페인도 데이터 중심 마케팅으로!
전사 전략적 고객 데이터 분석, 고객을 알아야만 서비스도 공략도 가능하다
우수 고객 프로그램, 형식적인 이벤트가 아닌 맞춤형 특별 서비스를 제공하라
11 통신 빅데이터 분석
통신 데이터, 사용자의 성향과 행동 패턴을 분석할 수 있는 빅데이터 중의 빅데이터
통화 데이터와 위치 데이터의 전처리 과정 살펴보기
통화 데이터와 위치 데이터의 패턴 분석 과정 살펴보기
12 부정 불법 감지
부정 불법 사고로 매년 매출액의 평균 5% 손실, 기업 이미지에도 치명적 타격
부정 불법 감지를 위한 데이터 분석 방법론 4가지
13 프랜차이즈 신규 가맹점, 매출 추정과 최적의 영업권 설정
창업 후 3년 안에 50%가 문을 닫는 자영업 시장에서 살아남으려면?
창업 전 합리적인 매출 추정으로 손익을 따져보자 매출 추정 방법 3가지
14 제조업 사례
변수가 많고 높은 정확성을 요구하는 제조업 데이터
제조업 분석에 쓰이는 알고리즘 살펴보기
사례 1: 초당 1개의 제품을 생산하는 빠른 공정에서 불량 제품 찾아내기
사례 2: 과부하로 인한 장비 멈춤 사고 예방하기 분석 못지않게 중요한 실시간 모니터링 시스템
넷째마당 빅데이터 2.0 : 데이터 경제
15 빅데이터 2.0 시대, 무엇을 준비해야 하나?
빅데이터 1.0 시대를 지나 2.0으로
공공 정보 공개, 데이터는 자산이다
공공 데이터 활용을 위한 첫걸음은 데이터 통합
외국의 가공 식별 번호 및 가공 데이터 판매 사례 살펴보기
국내외 데이터 시장 현황 살펴보기
16 데이터의 양면성, 보호 vs. 공개
데이터의 양면성, 보호와 공개의 두 얼굴
개인 정보 보호와 개인 정보 활용은 다르게 접근해야 한다
에필로그 데이터 과학자, 한국에서의 미래