한국EMC “가장 빠른 중복제거” 솔루션 발표
상태바
한국EMC “가장 빠른 중복제거” 솔루션 발표
  • 백업 시간에 대해서는 양측의 주장이 팽팽하다. 포스트 프로세싱 진영은 인라인 방식이 중복제
  • 승인 2010.04.21 16:34
  • 댓글 0
이 기사를 공유합니다

한국EMC가 중복제거 성능을 대폭 높인 데이터도메인 중복제거 솔루션 신제품을 발표했다.

21일 발표한 EMC 데이터도메인 글로벌 중복제거 어레이(GDA)는 EMC가 데이터도메인을 인수한 후 세번째 발표한 제품으로, 플러그인 소프트웨어와 다중 컨트롤러에 힘입어 중복제거와 백업을 동시에 하는 인라인 방식이면서도 포스트 프로세싱 방식보다 더 높은 중복제거 속도를 제공한다는 것이 한국EMC의 주장이다.

일반적으로 중복제거 후 백업하는 인라인 방식이 백업 후 중복제거하는 포스트 프로세싱 방식보다 속도가 느리다. 일단 데이터 중복성 여부를 블록 혹은 델타 단위로 분석해 중복되는 데이터를 제거한 후 실질적인 백업에 들어가기 때문이다. 그러나 단일본(싱글인스턴스)만 백업한다는 점에서 백업 인프라가 단순화된다. 한국EMC 박현호 부장은 “GDA 신제품은 인라인 방식 제품 중에서는 물론 포스트 프로세싱 방식을 모두 포함한 전체 중복제거 솔루션 중 가장 빠를 것”이라고 자신했다.

박현호 한국EMC 부장은 EMC 데이터도메인 GDA 신제품이 기업 백업 업무 효율성을 높여줄 것이라고 주장했다.
박현호 한국EMC 부장은 EMC 데이터도메인 GDA 신제품이 기업 백업 업무 효율성을 높여줄 것이라고 주장했다.
EMC GDA의 속도 향상은 데이터도메인 부스트 소프트웨어라는 플러그인 소프트웨어 때문이다. 데이터도메인 부스트는 데이터도메인 GDA가 수행해야 하는 중복제거 백업 프로세스를 일부 백업 서버에 분산시켜준다. 중복제거 백업의 프로세스는 백업 스트림의 세그먼트→세그먼트의 중복 체크→ 데이터 중복 제거 및 압축→백업의 4가지 단계로 이뤄지는데 이 중 앞의 두 단계를 백업 서버, 즉 백업 소프트웨어에서 수행하도록 하는 것이다.

현재 부스트를 플러그인해 사용할 수 있는 백업 소프트웨어로는 시만텍 넷백업과 백업EXEC가 있다. 오히려 EMC의 백업 소프트웨어인 네트워커보다 먼저 지원하고 있어 흥미롭다. 한국EMC는 곧 네트워커도 지원할 계획이라며 부스트를 사용하면 중복제거 백업 속도를 최대 50%까지 향상시킬 수 있다고 주장했다.

중복제거 속도를 높이는 두 번째 요인은 이중 컨트롤러다. GDA는 21일 함께 발표된 VTL 신제품 DD880에 탑재돼 어플라이언스 형태로 제공되는데 2개의 DD880 컨트롤러에 대해 데이터 중복제거를 하고 단일 네임스페이스를 지정할 수 있다. 이에 따라 시간 당 최대 12.7TB를 중복제거 후 백업할 수 있으며, 최대 270개의 동시 쓰기 스트림을 지원한다. 이에 따라 복제 타깃으로서 최대 270개의 원본을 수용할 수 있다.

한국EMC가 주장하는 GDA의 데이터 중복제거율은 50:1로, GDA를 이용하면 논리적으로는 최대 14.2PB의 데이터를 백업할 수 있게 된다. GDA 한 카피로 2개의 DD880 컨트롤러를 연결해 백업할 수 있는데 DD880 컨트롤러 1개 당 최대 142.5TB의 저장 용량을 제공한다. 즉 총 285TB의 단일본 데이터를 저장할 수 있는 것으로, 이는 복사본 등을 다수 포함한 14PB 데이터를 중복제거, 압축한 용량이 된다.

한국EMC는 데이터도메인 GDA와 아바마로 기업들의 다양한 백업 환경에서 중복 제거 기능을 제공한다는 계획이다. 아바마는 파일 기반 네트워크 백업으로 전통적인 테이프 백업과는 전혀 다른 아키텍처를 갖고 있다. 김민아 한국EMC 차장은 “일부 중첩되는 부분이 있긴 하지만 오히려 상호보완적인 형태로 활용할 수 있는 시장이 훨씬 크다”며 “파일 서버, NAS(Netowork Attached Storage), 가상화 환경, 원격지 해외지사 등 네트워크 기반 분산 환경에서 백업 데이터의 파일 갯수가 많은 환경에서는 아바마가, 일반적인 대용량 백업 환경에서는 데이터도메인이 적합하다”고 설명했다.

정민영 한국EMC 백업복구시스템사업본부 총괄 상무는 “2년 전만 해도 데이터 중복제거는 공급업체만의 이슈였지만 지금은 백업 인프라 환경의 필수요소로 여기는 등 기업들의 인식이 달라졌다”며 “백업 솔루션의 경쟁력과 다양성에서는 EMC를 따라올 곳이 없을 것”이라고 자신했다.

박현선기자 hspark@etnews.co.kr

중복제거 백업의 인라인 방식과 포스트 프로세싱 방식

기업 데이터 백업에서 중복되는 데이터를 제거한 후 단일본(싱글 인스턴스)을 저장하기 위해 사용하는 것이 중복제거(De-duplication) 솔루션이다.

오피스 스위트의 문서 파일, e메일의 첨부 파일 등 기업에는 동일 문서의 복사본들이 수십 카피 이상 존재하고 이는 데이터 백업에 많은 시간과 노력, 비용을 소모하게 만든다. 이를 해결하기 위해 중복제거 솔루션을 사용하는데, 중복제거 솔루션은 데이터의 중복성 여부를 확인, 중복 데이터를 제거한 후 백업하는 인라인 방식과, 일단 데이터를 백업한 후 백업 데이터에서 중복 부분을 제거하는 포스트 프로세싱 방식이 있다.

포스트 프로세싱 방식은 백업 후 중복제거하기 때문에 디스크나 테이프 등 백업 장비의 용량이 많이 필요하고 백업에 네트워크 대역폭을 많이 사용하게 된다. 이에 비해 중복제거 후 백업하는 인라인 방식은 단일본만 남긴 후 백업하기 때문에 네트워크 대역폭이나 백업 장비를 효율적으로 이용할 수 있다. 하지만 중복 여부 판단과 중복 제거를 먼저 하기 때문에 CPU와 메모리에 많이 의존한다.

백업 시간에 대해서는 양측의 주장이 팽팽하다. 포스트 프로세싱 진영은 인라인 방식이 중복제거를 먼저 하기 때문에 백업 프로세스가 완료되기까지 오랜 시간이 걸린다고 주장하며, 인라인 방식 진영은 데이터 중복제거를 하지 않고 대용량 데이터를 백업할 때, 특히 파일 수가 많은 데이터를 백업하는 것이 백업 윈도를 다수 발생시켜 오히려 백업 시간을 늘리게 된다고 주장한다. 박현선기자 hspark@etnews.co.kr


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사