전 세계 멈춘 ‘클라우드 대란’, 대안으로 떠오른 탈중앙화 클라우드 컴퓨팅
[블록미디어 정윤재] 지난주 마이크로소프트(MS)의 클라우드 서비스 ‘애저(Azure)’에 장애가 발생하며 항공기 2만3000편이 지연·취소되는 등 전 세계 항공·통신·금융·의료 서비스가 마비됐다.
애저는 MS의 클라우드 서비스로, 업계 2위이며 전 세계 시장 점유율 25%를 차지한다. 클라우드 솔루션은 기업이 자체적인 서버 인프라를 갖추지 않고도 데이터를 저장·관리할 수 있게 하며, 각종 어플리케이션의 배포·실행·운영 환경을 제공한다. 이번 장애로 인해 MS윈도우를 이용하는 850만 대의 기기가 영향을 받았고, 총 피해액은 1조4000억 원을 넘을 것으로 예상된다.
클라우드 시장은 연평균 20% 성장할 만큼 빠르게 성장 중이며, 올해 시장 규모는 약 922조 원(6630억 달러)에 달할 것으로 보인다. 그러나 클라우드 서비스의 편리함에도 불구하고 잠재적인 위험성도 존재한다. 중소 기업이 빅테크 기업에 의존도가 높아지면서 특정 기업에 문제가 발생하면 세계적인 피해가 커질 위험이 있다.
이번 애저 장애는 중앙 집중식 클라우드 서비스의 취약성을 여실히 드러냈다. 이로 인해 탈중앙화 클라우드 컴퓨팅에 대한 관심이 높아졌다. 탈중앙화 클라우드 컴퓨팅의 대표적인 예로 아카시 네트워크와 아이오넷이 있다.
# 실용성 입증한 분산형 클라우드 플랫폼, 아카시 네트워크
아카시 네트워크(Akash Network, AKT)는 코스모스 SDK로 만들어진 자체 메인넷 블록체인으로, 분산형 클라우드 플랫폼을 서비스하고 있다. 아카시 네트워크는 자체 플랫폼 ‘아카시 마켓플레이스(Akash Marketplace)’를 통해 컴퓨팅 파워 제공자와 사용자를 연결한다.
제공자는 CPU, GPU, 메모리, 스토리지 등 다양한 컴퓨팅 파워를 공급하며, 사용자는 필요한 서비스를 요청해 쉽게 이용할 수 있다. 서비스 비용은 아카시 토큰($AKT)으로 결제되며, 현재 모든 거래는 토큰으로만 이루어진다.
현재 아카시 네트워크 상에는 2000건 이상의 서비스 공급이 진행 중이며, 80개 이상의 공급자들이 서비스를 제공한다. 아카시 네트워크는 AI 모델 훈련에 필요한 연산 능력이 부족한 상황에서도 저렴한 비용으로 GPU를 빠르고 쉽게 확보할 수 있게 도와준다.
미국 콜럼비아 대학교의 컴퓨터공학과 대학원생 이샨 다나니(Ishan Dhanani)는 GPU 부족 문제를 블록체인을 통해 해결한 예이다. 그는 메타의 오픈 소스 AI 모델인 LLama2를 실험하려 했으나, 주요 공급자들이 대부분의 연산 능력을 차지하고 있어 어려움을 겪었다.
결국 그는 GPU를 블록체인에서 임대할 수 있는 아카시 네트워크를 통해 1시간에 1.10달러로 Nvidia A100(기존 가격 1만5000달러)을 사용할 수 있었다.
또한, 텍사스대학교 오스틴 캠퍼스와 앨버타대학교에서 발표한 새로운 논문 ‘Unified Auto-Encoding with Masked Diffusion’은 아카시 슈퍼클라우드를 통해 작성된 논문으로 주목받고 있다.
해당 논문은 NVIDIA A100 GPU 클러스터를 활용해 구현되었으며, 이 GPU 클러스터는 아카시 슈퍼클라우드에서 접근하여 사용했다. 해당 연구는 아카시 네트워크의 클라우드 컴퓨팅 자원을 효과적으로 활용해 고성능 연산을 실현한 점에서 의미가 있다.
# 무제한 컴퓨팅 파워를 제공하는 탈중앙화 GPU 네트워크, 아이오넷
아이오넷, 전 CEO 보유 물량 1년간 락업…“생태계 신뢰 이끌 것”
아이오넷(Io.net, IO)은 솔라나(Solana)를 메인넷으로 머신러닝 어플리케이션에 무제한 컴퓨팅 파워를 제공하기 위해 설계된 탈중앙화 GPU 네트워크다. 그들의 플랫폼은 단순하게 GPU 공급자와 사용자, 플랫폼 세 가지 구조로 이루어져 있다.
현재 아이오넷은 컴퓨팅 공급을 확충하기 위해 △독립 데이터 센터 △암호화폐 작업 증명 △소비자 GPU 분야의 유휴 자원을 주요 구성원으로 타게팅하고 있다.
아이오넷과 같은 분산화 물리 인프라 네트워크(DePIN)는 여러 독립된 노드에 작업을 분산시켜 단일 장애 지점의 위험을 줄인다. 일부 노드가 다운되더라도 다른 노드가 계속 작동해 전체 서비스 가용성을 유지할 수 있다. 이는 중앙 집중식 클라우드 시스템에 비해 장애 내성을 향상시킨다.
이번 MS 애저 장애는 중앙 집중식 클라우드 서비스의 취약성을 여실히 드러냈다. 이로 인해 탈중앙화 클라우드 컴퓨팅이 대안으로 떠오르고 있다. 아카시 네트워크와 아이오넷 같은 탈중앙화 클라우드 컴퓨팅 서비스는 높은 장애 내성과 비용 절감의 장점을 제공한다.
출처: 블록미디어