컨텐츠상세보기

엔터프라이즈 데이터 플랫폼 구축
엔터프라이즈 데이터 플랫폼 구축
  • 저자<얀 쿠닉크>,<이안 버스>,<폴 윌킨슨>,<라스 조지> 공저/<장현희>,<오명운> 공역
  • 출판사책만
  • 출판일2020-08-18
  • 등록일2020-10-13
보유 1, 대출 0, 예약 0, 누적대출 1, 누적예약 0

책소개

자체 시스템부터 클라우드까지 엔터프라이즈 하둡과 빅데이터 플랫폼 운영, 구축, 설계의 모든 것

빅데이터 기술에 대한 정보는 넘쳐나지만 이 모든 기술을 매끄럽게 연결해서 완벽한 엔터프라이즈 데이터 플랫폼을 구축하는 기법은 포괄적으로 다뤄지지 않은 어려운 작업이다. 『엔터프라이즈 데이터 플랫폼 구축』은 성공적인 모던 데이터 플랫폼을 온프레미스(on-premise)는 물론 클라우드 상에 성공적으로 구축하기 위한 지식을 습득할 수 있는 실용적인 내용이 가득 담겼다.

이 책은 엔터프라이즈 아키텍트, IT 관리자, 애플리케이션 아키텍트, 데이터 엔지니어에게 적합하며 하둡 프로젝트를 수행하는 동안 마주칠 수 있는 많은 도전과제들을 극복하는 방법을 소개한다. 또한 하둡과 빅데이터 환경 구축에 도움이 되는 광범위한 도구를 살펴볼 수 있을 것이다.

저자소개

2010년부터 기업용 하둡 솔루션을 다뤄왔다. 2014년 클라우데라 에 합류하기 전, IBM에서는 하둡을 위한 최적화된 시스템 아키텍처를 구축했으며, T시스템즈 에서는 서비스로서의 하둡(Hadoop-as-a-Service) 제품 구현을 담당했다. 현재는 클라우데라의 솔루션 아키텍트로서 기업 고객들의 하둡 프로젝트를 성공적으로 이끌며, 모든 산업군에서 빅데이터 애플리케이션을 구현하는 데 필요한 광범위한 아키텍처적 의사결정을 다루고 있다.

목차

1장  빅데이터 기술 기초 다지기
__하둡 에코시스템 둘러보기
__정리

[1부]  인프라스트럭처

2장  클러스터
__다중 클러스터 사용 이유
__멀티테넌시
__클러스터 용량 산정
__클러스터 확장
__데이터 복제
__정리

3장  연산과 스토리지
__하둡 이해를 위한 컴퓨터 아키텍처
__엔터프라이즈에 적합한 보급형 스토리지
__하둡과 리눅스 스토리지 스택
__이레이저 코딩과 복제
__로우레벨 스토리지
__서버 폼 팩터
__워크로드 프로파일
__클러스터 구성과 노드 종류
__정리

4장  네트워크
__서비스가 네트워크를 활용하는 방식
__네트워크 아키텍처
__네트워크 통합
__네트워크 설계 고려 사항
__정리

5장  조직의 과제
__누가 실행할 것인가
__인프라스트럭처인가 미들웨어인가 아니면 애플리케이션인가
__사례 연구: 보편적인 비즈니스 인텔리전스(BI) 프로젝트
__정리

6장  데이터센터 고려사항
__데이터센터는 왜 중요한가
__기본적인 데이터센터 개념
__공간과 랙 채우기의 제한
__데이터 수집 및 클러스터 간 연결
__교체 및 수리
__통상적인 위협
__정리

[2부]  플랫폼

7장  클러스터의 프로비저닝
__운영체제
__서비스 데이터베이스
__하둡 배포
__정리

8장  플랫폼 검증
__테스트 방법론
__유용한 도구들
__하드웨어 검증
__하둡의 검증
__다른 컴포넌트의 검증
__정리

9장  보안
__전송 중 암호화
__인증
__권한 부여
__유휴 시 암호화
__정리

10장  계정 서비스와의 통합
__통합이 필요한 영역
__통합 시나리오
__통합 계정 서비스
__LDAP 통합
__커버로스 통합
__인증서 관리
__정리

11장  클러스터의 접근 및 상호작용
__접근 메커니즘
__접근 토폴로지
__접근 보안
__워크벤치
__랜딩 존
__정리

12장  고가용성
__고가용성의 정의
__가용성의 측정
__고가용성의 운영
__고가용성 빌딩 블록
__일반적인 고려사항
__클러스터 서비스의 고가용성
__정리

13장  데이터 백업과 재해 복구
__컨텍스트
__데이터 복제
__하둡 클러스터 백업
__복구
__정리

[3부]  클라우드 기반 하둡

14장  하둡 가상화의 기초
__컴퓨트 가상화
__스토리지 가상화
__네트워크 가상화
__클러스터 수명주기 모델
__정리

15장  비공개 클라우드 솔루션
__오픈스택
__오픈시프트
__VMWare와 피보탈 클라우드 파운드리
__직접 만들어볼 텐가?
__비공개 클라우드를 위한 객체 스토리지
__정리

16장  공개형 클라우드 솔루션
__반드시 알아둘 것들
__클라우드 제공사
__클러스터 구현
__정리

17장  프로비저닝 자동화
__장기간 지속되는 클러스터
__일시적 클러스터
__메타데이터 공유 서비스
__정리

18장  클라우드 상의 보안
__위험의 평가
__위험 모델
__하둡을 위한 계정 프로바이더 옵션
__객체 스토리지 보안과 하둡
__감사
__유휴 시 데이터 암호화
__클라우드 상의 전송 중 데이터 암호화
__경계 제어와 방화벽 
__정리

부록  백업 온보딩 체크리스트
____백업 온보딩 체크리스트
____서비스