|
AZ는 데이터센터 하나를 의미한다. 리전은 데이터센터가 구축된 물리적 지역 범위를 말한다. 멀티 AZ는 리전 하나에 여러 데이터센터가 포진된 개념이다. AZ 하나에 문제가 생겨도 서비스에 할당된 인프라가 다른 AZ로 자동 전환돼 무중단 서비스가 가능하다.
이는 생성형 AI 서비스 개발·운영 측면에서도 필수적인 기술이다. 일부 대기업을 제외한 대다수 기업들이 CSP가 제공하는 클라우드 서비스를 사용하는 상황에서 인프라 안정성은 폭증하는 기업 AI 수요를 잡을 핵심 역량이기 때문이다.
AI 서비스는 대규모 데이터 기반 학습이 선행돼야 한다. 그러나 자체 데이터센터 구축에는 천문학적 투자가 필요하다. 실제로 AI 학습에 주로 사용되는 엔비디아 ‘A100’ 그래픽처리장치(GPU)는 1개 가격이 3000만원을 훌쩍 넘는다. 즉, 기업들의 클라우드 의존도는 지속적으로 높아질 수 밖에 없다는 의미다.
이에 국내 CSP사들은 멀티 AZ 구축에 열을 올리고 있다. 최근 카카오엔터프라이즈는 멀티 AZ를 지원하는 신규 리전을 오픈했다. 이들이 내세우는 강점은 ‘물리적으로 완전히 분리된 AZ’와 이를 연결할 ‘트랜짓 게이트웨이(TGW)’ 기술이다. 데이터센터 하나에서 층을 나눈 형태가 아니라 서로 다른 데이터센터내에 AZ를 구성하고, 이를 TGW를 통해 성능 저하없이 연결하는 점이 특징이다.
네이버클라우드 또한 지난 2018년부터 ‘멀티존(Multizone)’이라는 이름으로 멀티 AZ를 구성하고 있다. 멀티존은 리전 내에 물리적으로 분리된 데이터센터 및 네트워크로 구성된다. 현재 보유한 ‘각 춘천’과 코로케이션 데이터센터 뿐만 아니라 향후 지어질 ‘각 세종’ 또한 멀티 AZ로 구성될 예정이다.
NHN클라우드도 마찬가지다. 장애에 대비하기 위해 전체 시스템을 여러 AZ로 나눠 저장 시스템, 네트워크 스위치, 전원 장치 등을 별도로 구성했다. 각 AZ에서 생성된 자원 간에 네트워크 통신이 가능해 장애 시간을 최소화하는 점이 특징이다.
국내 CSP업계 관계자는 “하이퍼스케일 AI 서비스를 개발, 운영하려면 이를 받쳐줄 안정적 클라우드 서비스가 당연히 들어가야 한다”며 “자연어 처리, 음성인식 등 다양한 AI 서비스를 개발하기 위해서는 안정적 컴퓨팅 파워가 굉장히 중요한 시대”라고 말했다.