반응형 ServerlessGPU1 "Lambda는 부족하고 EKS는 무겁다: Modal이 GPU 인프라를 혁신하는 방법" 1. Modal 기술이란?1-1. 왜 필요한가 — 기존 방식의 한계2023년 LLM 폭발 이후, AI 워크로드는 세 가지 동시 요구를 던지기 시작했습니다.요청당 GPU가 필요하다. 단 한 번의 추론도 A100 또는 H100을 쥐어야 의미 있는 응답 시간이 나옵니다.0에서 수백 컨테이너로 즉시 확장되어야 한다. 콜드 스타트가 분 단위면 사용자가 떠납니다.Python 한 파일로 끝나야 한다. ML 엔지니어는 Dockerfile·Helm chart·Karpenter NodePool을 짜고 싶어 하지 않습니다.기존 솔루션들은 이 셋 중 하나 이상을 못 합니다.기존 방식못하는 것AWS LambdaGPU 없음, 15분 제한, 250MB 이미지 제한, 영속 볼륨 없음AWS SageMaker Endpoint콜드 스타트.. 2026. 5. 22. 이전 1 다음 반응형