엔터프라이즈 데이터 플랫폼 구축

전자도서관과 함께하는 스마트한 독서 생활 멀리 있는 서점 찾아 헤매지 말고, 가까운 곳에서 독서를 즐기세요.

MAIN > 전자책 > IT/프로그래밍 >

[데이터베이스/아키텍처] 엔터프라이즈 데이터 플랫폼 구축

엔터프라이즈 데이터 플랫폼 구축

저자: 얀 쿠닉크
출판사: 책만
출간일: 2020.06.26

평점 및 기타 정보
평점	(참여 0명)
페이지	684 Page	이용가능환경	PC, 스마트폰, 태블릿
서비스형태		파일크기	24 M
대출	0 / 1	예약	0

대출하기

콘텐츠 소개

자체 시스템부터 클라우드까지 엔터프라이즈 하둡과 빅데이터 플랫폼 운영, 구축, 설계의 모든 것

빅데이터 기술에 대한 정보는 넘쳐나지만 이 모든 기술을 매끄럽게 연결해서 완벽한 엔터프라이즈 데이터 플랫폼을 구축하는 기법은 포괄적으로 다뤄지지 않은 어려운 작업이다. 이 책은 성공적인 모던 데이터 플랫폼을 온프레미스(on-premise)는 물론 클라우드 상에 성공적으로 구축하기 위한 지식을 습득할 수 있는 실용적인 내용이 가득 담겼다.

이 책은 엔터프라이즈 아키텍트, IT 관리자, 애플리케이션 아키텍트, 데이터 엔지니어에게 적합하며 하둡 프로젝트를 수행하는 동안 마주칠 수 있는 많은 도전과제들을 극복하는 방법을 소개한다. 또한 하둡과 빅데이터 환경 구축에 도움이 되는 광범위한 도구를 살펴볼 수 있을 것이다.

■ 인프라스트럭처: 서버부터 데이터센터에 이르기까지, 기업 데이터를 위한 견고한 기반을 확립하는 모던 데이터 플랫폼을 구성하는 모든 컴포넌트 계층
■ 플랫폼: 배포, 운영, 보안, 고가용성, 재해 복구를 비롯해 기업 IT 환경에 플랫폼을 융합하기 위해 알아야 할 모든 것
■ 클라우드 기반의 하둡: 기업이 요구하는 보안 및 고가용성을 확보한 빅데이터 플랫폼을 클라우드 상에서 운영하기 위해 알아야 할 중요한 아키텍처적 요소들
저자 소개

저자 : 얀 쿠닉크
저자 : 얀 쿠닉크
Jan Kunigk
2010년부터 기업용 하둡 솔루션을 다뤄왔다. 2014년 클라우데라 에 합류하기 전, IBM에서는 하둡을 위한 최적화된 시스템 아키텍처를 구축했으며, T시스템즈 에서는 서비스로서의 하둡(Hadoop-as-a-Service) 제품 구현을 담당했다. 현재는 클라우데라의 솔루션 아키텍트로서 기업 고객들의 하둡 프로젝트를 성공적으로 이끌며, 모든 산업군에서 빅데이터 애플리케이션을 구현하는 데 필요한 광범위한 아키텍처적 의사결정을 다루고 있다.

저자 : 이안 버스
Ian Buss
브리스톨 대학에서 광자학 박사과정을 하는 동안 병렬 연산 전자기학으로 분산 컴퓨팅의 세계에 발을 들였다. 슈퍼컴퓨터의 LED에 대한 모의 실험 이후, 학계 위주의 빅 컴퓨트 분야에서 공공 부문의 빅데이터 분야로 옮겨 오면서 2012년 하둡을 처음 접했다. 하둡 클러스터를 이용한 구축, 배포, 관리 등에 큰 재미를 느끼고 2014년 솔루션 아키텍트로 클라우데라에 합류했다. 지금은 하둡을 기업에 통합하고 실제 환경에서 운영하는 데 기여하고 있다.

저자 : 폴 윌킨슨
Paul Wilkinson
하둡이 존재하기 이전부터 공공 부문의 빅데이터 분야에서 일했으며, 2009년 하둡의 등장을 매우 반겼다. 2012년 클라우데라에 컨설턴트로 합류한 후, 애플리케이션 디자인, 정보 아키텍처, 클러스터 관리, 인프라스트럭처 계획 등 하둡과 관련된 모든 부분에 대해 고객에게 조언을 아끼지 않고 있다. 금융 서비스, 사이버 보안, 광고 기술, 게임, 정부 등 전반에 걸쳐 수많은 전문 서비스 작업을 수행하면서 하둡에 관해서라면 단점까지도 모든 것을 지켜봐왔다. 혹은 최소한 자신이 그리 해왔기를 바란다

저자 : 라스 조지
Lars George
2007년부터 하둡 및 HBase와 관련된 일을 해왔으며 2009년 전업 HBase 커미터가 되었다. EMEA 수석 아키텍트로 클라우데라에서 5년 넘게 일했으며, 클라우데라 전문 서비스 팀과 고객을 연결하고, 유럽 전역의 파트너들과 협력해 차세대 데이터 주도 솔루션을 구축했다. 2016년에 직접 하둡 전문 기업을 설립해서, 자신이 8년 여간 현장에서 겪고 배운 경험을 살려 고객들을 돕고 있다. 『HBase 완벽 가이드』(오라일리)의 저자이기도 하다.

역자 : 장현희
캐나다 켈로나 소재의 QHR Technologies에서 시니어 소프트웨어 엔지니어로 근무 중이다. 21년째 개발자의 길을 걷고 있으며 총 25종의 개발 관련서를 집필하거나 번역했다.
국내 개발자들에게 조금이라도 도움이 되는 번역서를 만들기 위해 최선을 다하고 있으며, 책이라는 매개체를 통해 멀리서나마 국내 개발자들과의 소통을 지속하고자 노력하고 있다. 최근에는 『사이트 신뢰성 엔지니어링』(제이펍, 2018), 『클라우드 네이티브 자바』(책만, 2018), 『러스트 프로그래밍 공식 가이드』(제이펍, 2019) 등을 번역했다.

역자 : 오명운
백발 개발자를 꿈꾸며 언제나 버그와 씨름하는 개발자다. 번역을 통해 개발자 생태계에 조금이라도 보탬이 되고자 노력한다. 『스프링 마이크로서비스 2/e』(에이콘출판, 2018), 『클라우드 네이티브 자바』(책만, 2018), 『D3.js 실시간 데이터 시각화』(에이콘출판, 2015) 등을 번역했으며, 앞으로도 적은 양이라도 계속 번역 작업을 이어갈 생각이다.
https://homoefficio.github.io/에서 개발 관련 지식을 정리해서 나누고 있고, 잡다한 문제 해결 기록을 https://github.com/HomoEfficio/dev-tips에 남기고 있다.
목차

1장 빅데이터 기술 기초 다지기
__하둡 에코시스템 둘러보기
__정리

[1부] 인프라스트럭처

2장 클러스터
__다중 클러스터 사용 이유
__멀티테넌시
__클러스터 용량 산정
__클러스터 확장
__데이터 복제
__정리

3장 연산과 스토리지
__하둡 이해를 위한 컴퓨터 아키텍처
__엔터프라이즈에 적합한 보급형 스토리지
__하둡과 리눅스 스토리지 스택
__이레이저 코딩과 복제
__로우레벨 스토리지
__서버 폼 팩터
__워크로드 프로파일
__클러스터 구성과 노드 종류
__정리

4장 네트워크
__서비스가 네트워크를 활용하는 방식
__네트워크 아키텍처
__네트워크 통합
__네트워크 설계 고려 사항
__정리

5장 조직의 과제
__누가 실행할 것인가
__인프라스트럭처인가 미들웨어인가 아니면 애플리케이션인가
__사례 연구: 보편적인 비즈니스 인텔리전스(BI) 프로젝트
__정리

6장 데이터센터 고려사항
__데이터센터는 왜 중요한가
__기본적인 데이터센터 개념
__공간과 랙 채우기의 제한
__데이터 수집 및 클러스터 간 연결
__교체 및 수리
__통상적인 위협
__정리

[2부] 플랫폼

7장 클러스터의 프로비저닝
__운영체제
__서비스 데이터베이스
__하둡 배포
__정리

8장 플랫폼 검증
__테스트 방법론
__유용한 도구들
__하드웨어 검증
__하둡의 검증
__다른 컴포넌트의 검증
__정리

9장 보안
__전송 중 암호화
__인증
__권한 부여
__유휴 시 암호화
__정리

10장 계정 서비스와의 통합
__통합이 필요한 영역
__통합 시나리오
__통합 계정 서비스
__LDAP 통합
__커버로스 통합
__인증서 관리
__정리

11장 클러스터의 접근 및 상호작용
__접근 메커니즘
__접근 토폴로지
__접근 보안
__워크벤치
__랜딩 존
__정리

12장 고가용성
__고가용성의 정의
__가용성의 측정
__고가용성의 운영
__고가용성 빌딩 블록
__일반적인 고려사항
__클러스터 서비스의 고가용성
__정리

13장 데이터 백업과 재해 복구
__컨텍스트
__데이터 복제
__하둡 클러스터 백업
__복구
__정리

[3부] 클라우드 기반 하둡

14장 하둡 가상화의 기초
__컴퓨트 가상화
__스토리지 가상화
__네트워크 가상화
__클러스터 수명주기 모델
__정리

15장 비공개 클라우드 솔루션
__오픈스택
__오픈시프트
__VMWare와 피보탈 클라우드 파운드리
__직접 만들어볼 텐가?
__비공개 클라우드를 위한 객체 스토리지
__정리

16장 공개형 클라우드 솔루션
__반드시 알아둘 것들
__클라우드 제공사
__클러스터 구현
__정리

17장 프로비저닝 자동화
__장기간 지속되는 클러스터
__일시적 클러스터
__메타데이터 공유 서비스
__정리

18장 클라우드 상의 보안
__위험의 평가
__위험 모델
__하둡을 위한 계정 프로바이더 옵션
__객체 스토리지 보안과 하둡
__감사
__유휴 시 데이터 암호화
__클라우드 상의 전송 중 데이터 암호화
__경계 제어와 방화벽
__정리

부록 백업 온보딩 체크리스트
____백업 온보딩 체크리스트
____서비스
출판사 서평

[이 책의 구성과 독자대상]

1부에서는 기반 인프라스트럭처에 대한 이해를 통해 클러스터에 대한 견고한 기반을 확립한다. 2부에서는 플랫폼을 전체적으로 살펴보고 외부 시스템과 부드럽게 통합되는 견고한 클러스터를 구현하는 방법을 알아본다. 3부에서는 하둡을 클라우드에서 운영할 때 아키텍처 면에서 중요한 내용을 다룬다. 또한 하둡과 하둡 생태계에 대한 입문 수준의 기술적인 내용들도 다룬다.

◆ IT 관리자
기업에서 하둡 클러스터를 운영하는 책임을 가진 독자: 1장, 2장, 5장, 14장

◆ 엔터프라이즈 아키텍트
하둡 클러스터 통합 및 다른 기업용 시스템과의 연동을 모든 면에서 관리하며 클러스터를 기업 표준에 따라 운영하고 관리해야 하는 독자: 1~4장, 6~7장, 9~18장

◆ 애플리케이션 아키텍트와 데이터 엔지니어
차세대 데이터 기반 애플리케이션을 디자인하는 개발자와 아키텍트로서 하둡을 위한 코드를 작성하고 그 역량의 장점을 취하고자 하는 독자: 1~2장, 9~13장, 17~18장

◆ 시스템 관리자와 데이터베이스 관리자(DBA)
클러스터의 운영 및 모니터링을 책임지며 클러스터 컴포넌트들의 동작 방식과 기반 하드웨어 및 외부 시스템과의 통합에 대한 깊은 이해가 필요한 독자: 1장, 2장, 3장, 6~18장

[옮긴이의 글]
빅데이터라는 용어는 이미 수년 전부터 일상 생활에서까지 사용될 정도로 보편화되었습니다. 간혹 잘못 사용되는 경우도 없지는 않지만 빅데이터는 이제 정치, 사회, 경제, 문화, 과학 기술 등 거의 모든 영역에 걸쳐서 가장 중요한 키워드 중 하나로 자리잡고 있죠.
가장 큰 이유는 일상 생활의 많은 부분에서 데이터의 중요성이 부각되었기 때문입니다. 때문에 많은 기업들이 데이터 주도Data-Driven 문화를 도입하며 빅데이터 분석을 통해 더욱 편리한 사용자 경험의 제공, 제품과 서비스의 개선, 나아가 더 많은 이익 창출을 위해 노력하고 있습니다. 이 모든 노력의 근간에는 각 기업들이 오랜 시간을 들여 수집해 온 데이터가 있습니다.
하둡은 초기부터 빅데이터 솔루션으로 많은 관심을 받으며 빠르게 성장해 온 기술이자 프레임워크로, 대용량의 데이터를 저장하고 분석하여 좀 더 의미 있는 데이터를 산출하기 위한 포괄적인 기술들을 경제적으로 구현하기 위한 노력의 결정체입니다.
덕분에 이미 많은 기업이 하둡을 이용한 빅데이터 분석을 수행하고 있으며, 대부분은 아직 온프레미스 환경에 구축되어 있지만, 여러 공개형 클라우드 서비스들이 확장 가능한 하둡 서비스를 출시하면서 클라우드로의 이전도 활발히 진행되고 있습니다.
이 책은 온프레미스 환경부터 공개형 및 비공개 클라우드 환경에 이르기까지, 다양한 환경에서 기업을 위한 하둡 클러스터를 성공적으로 배포하고 운영하는 데 필요한 기술적 노하우를 아낌없이 전수해 줍니다.
저 또한 하둡 클러스터를 직접적으로 구축하고 운영해 본 경험이 아주 많지는 않지만, 그간 크고 작게나마 대용량의 데이터를 다양한 방법으로 처리해 본 경험 덕분에, 이 책을 통해 하둡을 좀 더 자세히 이해하게 되었으며, 빅데이터에 대해 만족할 만한 통찰을 얻을 수 있었습니다.
다만 이 책은 빅데이터에 처음 입문하는 초보자에게는 다소 어려울 수 있지만, 소규모라도 하둡 클러스터를 온프레미스 환경이나 클라우드 환경에서 구축하고 운영해 본 경험이 있는 독자들에게는 큰 도움이 될 수 있는 책입니다.
- 장현희

이젠 빅데이터를 활용하지 않는 분야가 없는 시대를 살고 있다고 해도 과언이 아닐 것 같습니다. 여러 분야에서 인간을 넘어서며 새로운 시대를 열 것으로 기대되는 인공 지능도 막대한 데이터가 없으면 학습을 할 수가 없습니다.
이 책은 빅데이터를 다루는 데 필요한 기본 개념부터, 실무에서 사용되는 다양한 컴포넌트의 장단점 비교, 여러 컴포넌트를 조합해서 구성하는 운영 환경 구축, 조직 구성까지 아우르는 방대한 내용을 다채로운 그림과 비교 표를 통해 압축해서 이해할 수 있게 도와줍니다. 그래서 이미 데이터 엔지니어링을 하고 있는 사람들에게는 이 책이 더 심도 있고 실무적인 지식의 보고가 될 수 있고, 데이터 엔지니어가 되고 싶어 하는 분들에게 이 책은 안정적인 출발선이 되어줄 것입니다.
모쪼록 이 책을 통해 많은 분이 한 단계 더 높이 올라설 수 있기를 바라며, 궁극적으로는 우리나라 개발자, 데이터 엔지니어들이 데이터가 원유가 되는 시대를 이끌어나가는 데 조금이라도 도움이 될 수 있다면 더 바랄 것이 없겠습니다.
- 오명운

오늘 :: 16
전체 :: 601,375

1 / 4

도서관명 : 강남구 전자도서관 | 주소 : 경기도

대표전화 : 02-0000-0000 | 팩스 : 0502-000-0000

(v20190214)

유틸메뉴

주메뉴

[데이터베이스/아키텍처] 엔터프라이즈 데이터 플랫폼 구축

콘텐츠 소개

저자 소개

목차

출판사 서평