전자도서관과 함께하는 스마트한 독서 생활 멀리 있는 서점 찾아 헤매지 말고, 가까운 곳에서 독서를 즐기세요.
MAIN > 전자책 > IT/프로그래밍 >

[데이터베이스/아키텍처] 엔터프라이즈 데이터 플랫폼 구축

엔터프라이즈 데이터 플랫폼 구축 

교보문고 전자책 스마트폰 태블릿
저자
얀 쿠닉크
출판사
책만
출간일
2020.06.26
평점 및 기타 정보
평점
(참여 0명) 리뷰쓰기-엔터프라이즈 데이터 플랫폼 구축
페이지 684 Page 이용가능환경 PC, 스마트폰, 태블릿
서비스형태 PDF 파일크기 24 M
대출 0 / 1 예약 0
  • 콘텐츠 소개


    자체 시스템부터 클라우드까지 엔터프라이즈 하둡과 빅데이터 플랫폼 운영, 구축, 설계의 모든 것

    빅데이터 기술에 대한 정보는 넘쳐나지만 이 모든 기술을 매끄럽게 연결해서 완벽한 엔터프라이즈 데이터 플랫폼을 구축하는 기법은 포괄적으로 다뤄지지 않은 어려운 작업이다. 이 책은 성공적인 모던 데이터 플랫폼을 온프레미스(on-premise)는 물론 클라우드 상에 성공적으로 구축하기 위한 지식을 습득할 수 있는 실용적인 내용이 가득 담겼다.

    이 책은 엔터프라이즈 아키텍트, IT 관리자, 애플리케이션 아키텍트, 데이터 엔지니어에게 적합하며 하둡 프로젝트를 수행하는 동안 마주칠 수 있는 많은 도전과제들을 극복하는 방법을 소개한다. 또한 하둡과 빅데이터 환경 구축에 도움이 되는 광범위한 도구를 살펴볼 수 있을 것이다.

    ■ 인프라스트럭처: 서버부터 데이터센터에 이르기까지, 기업 데이터를 위한 견고한 기반을 확립하는 모던 데이터 플랫폼을 구성하는 모든 컴포넌트 계층
    ■ 플랫폼: 배포, 운영, 보안, 고가용성, 재해 복구를 비롯해 기업 IT 환경에 플랫폼을 융합하기 위해 알아야 할 모든 것
    ■ 클라우드 기반의 하둡: 기업이 요구하는 보안 및 고가용성을 확보한 빅데이터 플랫폼을 클라우드 상에서 운영하기 위해 알아야 할 중요한 아키텍처적 요소들

  • 저자 소개


    저자 : 얀 쿠닉크
    저자 : 얀 쿠닉크
    Jan Kunigk
    2010년부터 기업용 하둡 솔루션을 다뤄왔다. 2014년 클라우데라 에 합류하기 전, IBM에서는 하둡을 위한 최적화된 시스템 아키텍처를 구축했으며, T시스템즈 에서는 서비스로서의 하둡(Hadoop-as-a-Service) 제품 구현을 담당했다. 현재는 클라우데라의 솔루션 아키텍트로서 기업 고객들의 하둡 프로젝트를 성공적으로 이끌며, 모든 산업군에서 빅데이터 애플리케이션을 구현하는 데 필요한 광범위한 아키텍처적 의사결정을 다루고 있다.

    저자 : 이안 버스
    Ian Buss
    브리스톨 대학에서 광자학 박사과정을 하는 동안 병렬 연산 전자기학으로 분산 컴퓨팅의 세계에 발을 들였다. 슈퍼컴퓨터의 LED에 대한 모의 실험 이후, 학계 위주의 빅 컴퓨트 분야에서 공공 부문의 빅데이터 분야로 옮겨 오면서 2012년 하둡을 처음 접했다. 하둡 클러스터를 이용한 구축, 배포, 관리 등에 큰 재미를 느끼고 2014년 솔루션 아키텍트로 클라우데라에 합류했다. 지금은 하둡을 기업에 통합하고 실제 환경에서 운영하는 데 기여하고 있다.

    저자 : 폴 윌킨슨
    Paul Wilkinson
    하둡이 존재하기 이전부터 공공 부문의 빅데이터 분야에서 일했으며, 2009년 하둡의 등장을 매우 반겼다. 2012년 클라우데라에 컨설턴트로 합류한 후, 애플리케이션 디자인, 정보 아키텍처, 클러스터 관리, 인프라스트럭처 계획 등 하둡과 관련된 모든 부분에 대해 고객에게 조언을 아끼지 않고 있다. 금융 서비스, 사이버 보안, 광고 기술, 게임, 정부 등 전반에 걸쳐 수많은 전문 서비스 작업을 수행하면서 하둡에 관해서라면 단점까지도 모든 것을 지켜봐왔다. 혹은 최소한 자신이 그리 해왔기를 바란다

    저자 : 라스 조지
    Lars George
    2007년부터 하둡 및 HBase와 관련된 일을 해왔으며 2009년 전업 HBase 커미터가 되었다. EMEA 수석 아키텍트로 클라우데라에서 5년 넘게 일했으며, 클라우데라 전문 서비스 팀과 고객을 연결하고, 유럽 전역의 파트너들과 협력해 차세대 데이터 주도 솔루션을 구축했다. 2016년에 직접 하둡 전문 기업을 설립해서, 자신이 8년 여간 현장에서 겪고 배운 경험을 살려 고객들을 돕고 있다. 『HBase 완벽 가이드』(오라일리)의 저자이기도 하다.

    역자 : 장현희
    캐나다 켈로나 소재의 QHR Technologies에서 시니어 소프트웨어 엔지니어로 근무 중이다. 21년째 개발자의 길을 걷고 있으며 총 25종의 개발 관련서를 집필하거나 번역했다.
    국내 개발자들에게 조금이라도 도움이 되는 번역서를 만들기 위해 최선을 다하고 있으며, 책이라는 매개체를 통해 멀리서나마 국내 개발자들과의 소통을 지속하고자 노력하고 있다. 최근에는 『사이트 신뢰성 엔지니어링』(제이펍, 2018), 『클라우드 네이티브 자바』(책만, 2018), 『러스트 프로그래밍 공식 가이드』(제이펍, 2019) 등을 번역했다.

    역자 : 오명운
    백발 개발자를 꿈꾸며 언제나 버그와 씨름하는 개발자다. 번역을 통해 개발자 생태계에 조금이라도 보탬이 되고자 노력한다. 『스프링 마이크로서비스 2/e』(에이콘출판, 2018), 『클라우드 네이티브 자바』(책만, 2018), 『D3.js 실시간 데이터 시각화』(에이콘출판, 2015) 등을 번역했으며, 앞으로도 적은 양이라도 계속 번역 작업을 이어갈 생각이다.
    https://homoefficio.github.io/에서 개발 관련 지식을 정리해서 나누고 있고, 잡다한 문제 해결 기록을 https://github.com/HomoEfficio/dev-tips에 남기고 있다.


  • 목차

    1장 빅데이터 기술 기초 다지기
    __하둡 에코시스템 둘러보기
    __정리

    [1부] 인프라스트럭처

    2장 클러스터
    __다중 클러스터 사용 이유
    __멀티테넌시
    __클러스터 용량 산정
    __클러스터 확장
    __데이터 복제
    __정리

    3장 연산과 스토리지
    __하둡 이해를 위한 컴퓨터 아키텍처
    __엔터프라이즈에 적합한 보급형 스토리지
    __하둡과 리눅스 스토리지 스택
    __이레이저 코딩과 복제
    __로우레벨 스토리지
    __서버 폼 팩터
    __워크로드 프로파일
    __클러스터 구성과 노드 종류
    __정리

    4장 네트워크
    __서비스가 네트워크를 활용하는 방식
    __네트워크 아키텍처
    __네트워크 통합
    __네트워크 설계 고려 사항
    __정리

    5장 조직의 과제
    __누가 실행할 것인가
    __인프라스트럭처인가 미들웨어인가 아니면 애플리케이션인가
    __사례 연구: 보편적인 비즈니스 인텔리전스(BI) 프로젝트
    __정리

    6장 데이터센터 고려사항
    __데이터센터는 왜 중요한가
    __기본적인 데이터센터 개념
    __공간과 랙 채우기의 제한
    __데이터 수집 및 클러스터 간 연결
    __교체 및 수리
    __통상적인 위협
    __정리

    [2부] 플랫폼

    7장 클러스터의 프로비저닝
    __운영체제
    __서비스 데이터베이스
    __하둡 배포
    __정리

    8장 플랫폼 검증
    __테스트 방법론
    __유용한 도구들
    __하드웨어 검증
    __하둡의 검증
    __다른 컴포넌트의 검증
    __정리

    9장 보안
    __전송 중 암호화
    __인증
    __권한 부여
    __유휴 시 암호화
    __정리

    10장 계정 서비스와의 통합
    __통합이 필요한 영역
    __통합 시나리오
    __통합 계정 서비스
    __LDAP 통합
    __커버로스 통합
    __인증서 관리
    __정리

    11장 클러스터의 접근 및 상호작용
    __접근 메커니즘
    __접근 토폴로지
    __접근 보안
    __워크벤치
    __랜딩 존
    __정리

    12장 고가용성
    __고가용성의 정의
    __가용성의 측정
    __고가용성의 운영
    __고가용성 빌딩 블록
    __일반적인 고려사항
    __클러스터 서비스의 고가용성
    __정리

    13장 데이터 백업과 재해 복구
    __컨텍스트
    __데이터 복제
    __하둡 클러스터 백업
    __복구
    __정리

    [3부] 클라우드 기반 하둡

    14장 하둡 가상화의 기초
    __컴퓨트 가상화
    __스토리지 가상화
    __네트워크 가상화
    __클러스터 수명주기 모델
    __정리

    15장 비공개 클라우드 솔루션
    __오픈스택
    __오픈시프트
    __VMWare와 피보탈 클라우드 파운드리
    __직접 만들어볼 텐가?
    __비공개 클라우드를 위한 객체 스토리지
    __정리

    16장 공개형 클라우드 솔루션
    __반드시 알아둘 것들
    __클라우드 제공사
    __클러스터 구현
    __정리

    17장 프로비저닝 자동화
    __장기간 지속되는 클러스터
    __일시적 클러스터
    __메타데이터 공유 서비스
    __정리

    18장 클라우드 상의 보안
    __위험의 평가
    __위험 모델
    __하둡을 위한 계정 프로바이더 옵션
    __객체 스토리지 보안과 하둡
    __감사
    __유휴 시 데이터 암호화
    __클라우드 상의 전송 중 데이터 암호화
    __경계 제어와 방화벽
    __정리

    부록 백업 온보딩 체크리스트
    ____백업 온보딩 체크리스트
    ____서비스

  • 출판사 서평

    [이 책의 구성과 독자대상]

    1부에서는 기반 인프라스트럭처에 대한 이해를 통해 클러스터에 대한 견고한 기반을 확립한다. 2부에서는 플랫폼을 전체적으로 살펴보고 외부 시스템과 부드럽게 통합되는 견고한 클러스터를 구현하는 방법을 알아본다. 3부에서는 하둡을 클라우드에서 운영할 때 아키텍처 면에서 중요한 내용을 다룬다. 또한 하둡과 하둡 생태계에 대한 입문 수준의 기술적인 내용들도 다룬다.

    ◆ IT 관리자
    기업에서 하둡 클러스터를 운영하는 책임을 가진 독자: 1장, 2장, 5장, 14장

    ◆ 엔터프라이즈 아키텍트
    하둡 클러스터 통합 및 다른 기업용 시스템과의 연동을 모든 면에서 관리하며 클러스터를 기업 표준에 따라 운영하고 관리해야 하는 독자: 1~4장, 6~7장, 9~18장

    ◆ 애플리케이션 아키텍트와 데이터 엔지니어
    차세대 데이터 기반 애플리케이션을 디자인하는 개발자와 아키텍트로서 하둡을 위한 코드를 작성하고 그 역량의 장점을 취하고자 하는 독자: 1~2장, 9~13장, 17~18장

    ◆ 시스템 관리자와 데이터베이스 관리자(DBA)
    클러스터의 운영 및 모니터링을 책임지며 클러스터 컴포넌트들의 동작 방식과 기반 하드웨어 및 외부 시스템과의 통합에 대한 깊은 이해가 필요한 독자: 1장, 2장, 3장, 6~18장

    [옮긴이의 글]
    빅데이터라는 용어는 이미 수년 전부터 일상 생활에서까지 사용될 정도로 보편화되었습니다. 간혹 잘못 사용되는 경우도 없지는 않지만 빅데이터는 이제 정치, 사회, 경제, 문화, 과학 기술 등 거의 모든 영역에 걸쳐서 가장 중요한 키워드 중 하나로 자리잡고 있죠.
    가장 큰 이유는 일상 생활의 많은 부분에서 데이터의 중요성이 부각되었기 때문입니다. 때문에 많은 기업들이 데이터 주도Data-Driven 문화를 도입하며 빅데이터 분석을 통해 더욱 편리한 사용자 경험의 제공, 제품과 서비스의 개선, 나아가 더 많은 이익 창출을 위해 노력하고 있습니다. 이 모든 노력의 근간에는 각 기업들이 오랜 시간을 들여 수집해 온 데이터가 있습니다.
    하둡은 초기부터 빅데이터 솔루션으로 많은 관심을 받으며 빠르게 성장해 온 기술이자 프레임워크로, 대용량의 데이터를 저장하고 분석하여 좀 더 의미 있는 데이터를 산출하기 위한 포괄적인 기술들을 경제적으로 구현하기 위한 노력의 결정체입니다.
    덕분에 이미 많은 기업이 하둡을 이용한 빅데이터 분석을 수행하고 있으며, 대부분은 아직 온프레미스 환경에 구축되어 있지만, 여러 공개형 클라우드 서비스들이 확장 가능한 하둡 서비스를 출시하면서 클라우드로의 이전도 활발히 진행되고 있습니다.
    이 책은 온프레미스 환경부터 공개형 및 비공개 클라우드 환경에 이르기까지, 다양한 환경에서 기업을 위한 하둡 클러스터를 성공적으로 배포하고 운영하는 데 필요한 기술적 노하우를 아낌없이 전수해 줍니다.
    저 또한 하둡 클러스터를 직접적으로 구축하고 운영해 본 경험이 아주 많지는 않지만, 그간 크고 작게나마 대용량의 데이터를 다양한 방법으로 처리해 본 경험 덕분에, 이 책을 통해 하둡을 좀 더 자세히 이해하게 되었으며, 빅데이터에 대해 만족할 만한 통찰을 얻을 수 있었습니다.
    다만 이 책은 빅데이터에 처음 입문하는 초보자에게는 다소 어려울 수 있지만, 소규모라도 하둡 클러스터를 온프레미스 환경이나 클라우드 환경에서 구축하고 운영해 본 경험이 있는 독자들에게는 큰 도움이 될 수 있는 책입니다.
    - 장현희

    이젠 빅데이터를 활용하지 않는 분야가 없는 시대를 살고 있다고 해도 과언이 아닐 것 같습니다. 여러 분야에서 인간을 넘어서며 새로운 시대를 열 것으로 기대되는 인공 지능도 막대한 데이터가 없으면 학습을 할 수가 없습니다.
    이 책은 빅데이터를 다루는 데 필요한 기본 개념부터, 실무에서 사용되는 다양한 컴포넌트의 장단점 비교, 여러 컴포넌트를 조합해서 구성하는 운영 환경 구축, 조직 구성까지 아우르는 방대한 내용을 다채로운 그림과 비교 표를 통해 압축해서 이해할 수 있게 도와줍니다. 그래서 이미 데이터 엔지니어링을 하고 있는 사람들에게는 이 책이 더 심도 있고 실무적인 지식의 보고가 될 수 있고, 데이터 엔지니어가 되고 싶어 하는 분들에게 이 책은 안정적인 출발선이 되어줄 것입니다.
    모쪼록 이 책을 통해 많은 분이 한 단계 더 높이 올라설 수 있기를 바라며, 궁극적으로는 우리나라 개발자, 데이터 엔지니어들이 데이터가 원유가 되는 시대를 이끌어나가는 데 조금이라도 도움이 될 수 있다면 더 바랄 것이 없겠습니다.
    - 오명운