V3·R1 추론 모델의 하루 운영비 8.7만 달러, 수익 56.2만 달러 창출
"저렴한 가격정책과 무료 서비스로 실제 수익은 더 낮을 수 있어"
"저렴한 가격정책과 무료 서비스로 실제 수익은 더 낮을 수 있어"

슬롯 머신 사이트는 지난 2월 27일 베이징 시간 정오부터 V3 및 R1 추론 모델에서 평균 노드 점유율 226.75대를 기록했다고 발표했다. 8개의 엔비디아 H800 GPU로 구성된 각 노드는 시간당 2달러의 비용으로 임대됐으며, 이에 따른 총 운영비용은 8만7072달러로 집계됐다.
같은 기간 이 모델들은 웹, 모바일 앱, API를 통한 사용자 요청을 포함해 총 6080억 개의 입력 토큰과 1680억 개의 출력 토큰을 처리했다. 슬롯 머신 사이트 R1의 가격 책정 모델을 기준으로 하면 이는 56만2027달러의 수익에 해당하며, 이론상 545%의 이익률을 나타낸다.
저장성 항저우에 본사를 둔 슬롯 머신 사이트는 올해 미국 경쟁사보다 훨씬 저렴한 비용으로 구축된 우수한 AI 모델을 공개해 기술 업계에 충격을 안겼다. 이 발표는 엔비디아를 포함한 미국 기술주 시장가치에서 수십억 달러를 증발시키는 데 영향을 미쳤으며, 홍콩에서는 중국 기술주의 강세장을 이끌었다.
슬롯 머신 사이트의 API 서비스는 다른 유명 AI 모델보다 가격이 현저히 저렴하다. V3 모델은 캐시 적중에 대해 100만 토큰당 0.07달러, 캐시 누락에 대해 100만 토큰당 0.27달러, 출력에 대해 100만 토큰당 1.10달러를 청구한다. R1 고급 추론 모델에 대해서는 두 배의 비용을 청구하고 있으며, 2월 27일부터는 V3의 경우 50%, R1의 경우 75%의 야간 할인을 제공하기 시작했다.
이러한 높은 이윤은 슬롯 머신 사이트의 기술적 효율성 향상을 보여준다. 회사 측은 "더 높은 처리량과 더 낮은 대기 시간"을 중심으로 구축된 시스템 설계를 강조하며, 대규모 크로스 노드 Expert Parallelism 솔루션을 공개했다.
슬롯 머신 사이트는 언론 인터뷰를 거절하며 낮은 프로필을 유지해 왔지만, 깃허브에서 여러 오픈 소스 프로젝트를 공유하고 모델 훈련의 핵심인 컴퓨팅, 통신, 스토리지 전반에 걸친 최적화 방법을 상세히 설명하며 개발자들과 지속 소통하고 있다.
설립자 량원펑은 지난해 슬롯 머신 사이트 기술 매체 36Kr과의 인터뷰에서 "연구와 기술 혁신은 항상 우리의 최우선 과제가 될 것"이라며 "우리의 원칙은 돈을 잃지 않는 것이지만 엄청난 이익을 추구하지 않는 것"이라고 강조했다. 그는 "가격 책정은 비용 이상의 적당한 마진을 제공하는 것을 목표로 한다"고 덧붙였다.
슬롯 머신 사이트의 혁신에 자극받아 글로벌 기술기업들도 신제품을 선보이고 있다. 오픈AI는 최근 GPT-4 제품군의 최신 모델인 GPT 4.5의 초기 버전을 출시했으며, 아마존이 지원하는 앤트로픽은 수학과 코딩에서 향상된 성능을 보이는 Claude 3.7 Sonnet을 소개했다.
알리바바 그룹은 Qwen2.5-Max를 기반으로 구축된 차세대 추론 모델인 QwQ-Max를 미리 선보였으며, 텐센트 홀딩스는 슬롯 머신 사이트의 R1이나 오픈AI의 o1보다 더 빠른 응답을 생성하도록 설계된 모델인 터보 S를 공개했다.
신민철 글로벌이코노믹 기자 shincm@g-enews.com