25.04.18
우리가 제1부에서 다룬 폰 노이만 아키텍처를 다시 살펴보면, 그 안에는 컴퓨팅, 네트워크, 스토리지가
있습니다. 간단하게 말하자면 컴퓨팅 엔진과 그보다 더 복잡한 형제인 애플리케이션은 명령을 실행하고 결과를
제공합니다. 계산이 끝나면 컴퓨팅 엔진은 초기 상태로 리셋되어 다음 계산을 준비합니다. 컴퓨팅은 일시적인 기능이며 이전 상태를 기억하지 않습니다. 네트워킹도
대부분의 경우 비슷합니다. 데이터를 받아서 캡슐화하고 목적지 주소를 적용한 후 패킷을 네트워크로 전송합니다. 패킷이 수신되지 않으면 단순히 재전송됩니다. 전송 후 라우터는 리셋됩니다. 하지만 스토리지 요소는 Stateless (무상태 구조)가 아니라 Stateful (상태유지 구조)입니다. 저장 시스템에 전송된 비트는 기록되어 저장됩니다. 이 정보는 몇 분, 몇 시간, 며칠, 몇 달, 몇 년, 몇십
년, 그리고 어떤 경우에는 몇 세기까지 저장될 필요가 있을 수 있습니다. 저는 이를 은행 계좌에 비유하는 것을 좋아합니다. 예금을 하고, 월간 감사서를 받으며, 언제든지 향후에 인출할 수 있기를 기대합니다. 은행과 스토리지에서는 고객에게 돈/데이터를 항상 잘 관리해야 한다는
장기적인 신탁 의무가 있으며, 이는 먼 미래까지 이어질 수 있는 책임입니다. 모든 컨테이너의 장점에도 불구하고, 그것이 Stateless (무상태 구조)가 아니라면 스토리지 기술에 혁신을
가져올 수 있는 게임 체인저 기술이 될 수 있을 것입니다.
데이터 중심 저장 방식 – 스토리지 혁명의 시작
Stateless (무상태 구조) 문제를
해결할 수 있다고 가정하고, 컨테이너 기술이 스토리지에 어떻게 적용될 수 있을지 살펴보겠습니다. Dragonslayer의 Marc Staimer와 이 작업을 진행하면서
그는 데이터와 운영 체제 및 하드웨어를 분리하고, 데이터 중심의 컨테이너를 만드는 것과 그로 인한 파급
효과를 즉시 이해했습니다. Marc는 '모든 것은 데이터에
관한 것입니다. 이것이 진정한 '데이터 중심' 접근 방식입니다.'라고 말했습니다.
이는 수많은 해를 거쳐 스토리지 분야에서 일어난 진정한 게임 체인저 중 하나입니다. 한번
살펴보겠습니다.
l
이동성(portability)은
컨테이너의 핵심 기능 중 하나입니다. 만약 컨테이너가 데이터로 채워져 있다면, 그 데이터는 온프레미스 시스템 간에, 그리고 공공 및 사설 클라우드를
통해 손쉽게 이동할 수 있으며, 그 안에 저장된 데이터에는 영향을 주지 않습니다. 이 데이터 중심의 기능은 고객에게 데이터를 시장에서 가장 비용 효율적인 솔루션으로 이동할 수 있는 다양한 옵션을
제공할 것입니다. 특히 보관 기간이 10년, 25년, 50년, 많은
경우 100년으로 연장되고 있기 때문입니다. 100년 보관
시나리오에서 조직은 6~8개의 스토리지 기존 시스템을 순환하면서 시스템 간에 6~8개의 데이터 전송을 수행합니다. 이 과정에서 데이터 무결성을
유지해야 합니다. 반면, 컨테이너를 사용하면 데이터 내용에
영향을 주거나 변경 없이 컨테이너 전체를 한 번에 이동할 수 있습니다.
l
미래를 대비한 기술. 컨테이너는
오픈 소스 표준을 기반으로 하므로, 컨테이너와 외부 세계 간의 애플리케이션 프로그래밍 인터페이스(API)는 지속적으로 업데이트됩니다. 새로운 운영 체제와 하드웨어의
발전이 기존 API에 통합되어, 컨테이너 관점에서는 이를
원활하게 사용할 수 있습니다. 전통적으로 스토리지 기술은 미래를 대비하는 기능이 없었습니다. 저는 이를 'Zip 드라이브 문제'라고
불렀는데, 당시에는 놀라운 기술이었지만, 지금은 Zip 플로피 디스크가 쌓여 있고 Zip 드라이버 리더를 잃어버려서
그 디스크에 저장된 모든 데이터에 접근할 수 없는 상황입니다. 비슷한 문제가 발생한 엔터프라이즈 시스템
스토리지는 많으며, 이러한 시스템은 더 이상 지원되지 않지만, 그
안에는 중요한 데이터가 저장되어 있습니다. "데이터 중심"
관점에서 볼 때, 더 많은 정보가 보존 의무의 대상이 되면서 10년, 25년, 50년, 100년 후에 데이터에 액세스할 수 있는 것은 중요한 고려 사항입니다. 기존
스토리지 공급업체가 10년 후에도 존재할 것이라고 베팅하는 것은 도전이며, 기술 시장의 회전율 맥락에서 100년 후에도 존재할 것이라고 베팅하는
것은 비현실적입니다. 스토리지나 클라우드 공급자에 무슨 일이 생기더라도, 조직은 여전히 여러 보존 기간에 걸쳐 최대 100년까지 데이터에
즉시 액세스하고 복제해야하는 의무가 있습니다.
l
가변적인 페이로드 또는 가변적인 컨테이너는 또 다른 흥미로운 기능입니다. LTO와 같은 다른 표준은 물리적 한계로 인해 용량이 고정되어 있는 반면, 컨테이너는
이론적으로 무한합니다. 이 유연성은 매우 큰 컨테이너를 가능하게 하여,
장기 아카이브 스토리지의 비용 효율성을 위해 하이퍼 중복 제거 및 압축을 제공할 수 있습니다. 또는 eDiscovery와 같은 접근성 제한이 있는 경우, 컨테이너 크기를
더 작게 설정하여 빠른 검색을 지원할 수 있습니다.
l 수동
및 능동적인 컨테이너 기능은 컨테이너의 또 다른 이점으로, 많은 영향을 미치며 새로운 기능과
기능성이 넓은 범위를 제공합니다. 강력한 불변 보존 기능과 보존 만료 시 보안 삭제 기능이 추가된 필수
컨테이너를 저장하면, 새로운 보존 의무로 인한 데이터 폭증을 관리하려는 조직에 큰 비용 절감 효과를
가져올 수 있습니다. 또 다른 중요한 우려 사항은 특히 데이터를 공공 클라우드에 저장할 때 데이터 무결성입니다. 능동적 및 수동적 기능을 갖춘 컨테이너는 자체 건강 기록을 유지할 수 있습니다. 데이터 무결성 건강 점검을 예약하고, 데이터 건강, 접근 로그, 접근 시도 로그, 사이버
위협 경고, 그리고 체크섬 또는 해시 검사와 함께 기록된 로그를 통해
10년, 25년, 50년, 100년 전에 저장된 데이터가 여전히 컨테이너에 있는 데이터와 동일함을 확인할 수 있습니다. 규정 준수, 법적 감사, 개인정보
보호 감사, eDiscovery의 증거 관리 절차 등에서 데이터 무결성 기능은 향후 모든 스토리지 제품과
서비스에서 필수 기능이 될 가능성이 큽니다.
따라서, 컨테이너는 시스템의 수명이 끝나면서 발생하는 데이터 이동성
문제를 해결할 수 있습니다. 이는 장기 저장, 백업 및 아카이브에서
스토리지 산업을 항상 괴롭혀온 문제였습니다. 데이터 중심 접근 방식은 시스템의 속도와 성능이 아니라, 데이터의 기밀성, 무결성, 접근성, 가용성 및 부인 방지를 중심으로 산업의 초점을 재조정할 것입니다. 이는
끝이 없는 스토리지 엔드포인트와 증가하는 사이버 위협의 새로운 세계에서 이루어질 것입니다.
컨테이너는 Stateless (무상태 구조) 문제를 해결하고 지속 가능한 가상 스토리지 컨테이너가 만들어진다면 스토리지 산업을 혁신할 수 있는 힘을 가지고
있습니다.
참조: FalconStor Software. (2020, March 3). The
100-year Archive and the Data Preservation Explosion—Part Three: The Impending
“Data-Centric” Storage Revolution. FalconStor. https://www.falconstor.com/falcblog/the-100-year-archive-and-the-data-preservation-explosion-part-three/