본문 바로가기
반응형

분류 전체보기543

Caddy란? 자동 HTTPS 시대의 웹 서버와 리버스 프록시 Caddy는 웹 서버, 정적 파일 서버, 리버스 프록시 역할을 수행하면서 HTTPS 인증서 발급·갱신을 자동화하는 Go 기반 오픈소스 서버입니다. Nginx + Certbot + Cron + Reload Hook 조합으로 운영하던 인증서 관리 부담을 줄이고, Docker·내부 도구·소규모 서비스·고객 도메인 연결 환경에서 특히 강점을 보입니다.Ⅰ. 왜 Caddy가 필요한가?웹 서비스를 운영할 때 가장 먼저 마주치는 문제는 애플리케이션 실행이 아니라 외부 접속 구조를 안전하게 만드는 일입니다. 서비스를 공개하려면 보통 다음 작업이 필요합니다.도메인 연결 → 웹 서버 설치 → Reverse Proxy 구성 → HTTPS 인증서 발급 → 인증서 경로 설정 → 인증서 자동 갱신 설정 → 갱신 후 웹 서버 rel.. 2026. 6. 5.
오픈소스 가상화와 프라이빗 클라우드 인프라, Proxmox VE Ⅰ. Proxmox란 무엇인가?Proxmox VE(Proxmox Virtual Environment)는 물리 서버 위에서 가상머신과 컨테이너를 운영하기 위한 오픈소스 가상화 관리 플랫폼입니다. 핵심은 단순한 하이퍼바이저가 아니라, Compute·Storage·Network·Backup·HA·권한관리를 하나의 Datacenter 관점에서 묶어 관리한다는 점입니다.가상머신은 KVM/QEMU 기반으로 실행하고, 컨테이너는 LXC 기반으로 실행합니다. 운영자는 웹 브라우저에서 VM 생성, 디스크 증설, 스냅샷, 백업, 클러스터 구성, HA 정책, 방화벽, 네트워크 브리지, 스토리지 연결을 관리할 수 있습니다.한 줄 정의Proxmox VE는 “오픈소스 기반의 서버 가상화 + HCI + 프라이빗 클라우드 운영 콘솔.. 2026. 6. 4.
Mojo 완벽 정리 - Python superset이자 MLIR 기반 AI 시스템 언어 이 글은 "AI 스택은 왜 10년째 두 언어로 쪼개져 있고, Mojo는 그것을 어떤 아키텍처로 한 언어 안에 합치려 하는가, 그리고 어디까지 쓰고 어디부터는 쓰면 안 되는가"를 한 번에 정리합니다. Mojo는 LLVM·Clang·Swift·MLIR을 만든 Chris Lattner가 Modular Inc.에서 시작한, Python의 superset이자 systems 프로그래밍 언어입니다. Python 문법을 그대로 받되 fn·struct·SIMD[T,N]·borrow 같은 시스템 키워드를 추가해 인터프리터 없이 MLIR로 컴파일하고, GIL이 없으며, GPU 커널을 같은 파일에 같은 문법으로 작성합니다. 즉 PyTorch wrapper(Python) + CUDA kernel(C++) 두 언어로 갈라지던 A.. 2026. 5. 31.
SQLite의 한계를 넘다: libSQL과 Turso가 여는 엣지 분산 데이터베이스의 미래 목차Turso(libSQL)란? — 왜 필요한가, 정의Turso(libSQL)의 특징동작 방식 — 구성 요소와 데이터 흐름구성 및 흐름도 — 단계별 처리설치 방법사용 방법 — 코드/설정과 운영 고려사항자주 쓰는 명령어와 사례활용 방안 — 대안 비교와 "언제 쓰면 안 되는가"1. Turso(libSQL)란? — 왜 필요한가, 그리고 정의왜 필요한가 — SQLite의 90년대식 제약 4가지SQLite는 세상에서 가장 많이 배포된 데이터베이스다. 모든 iOS·Android 앱, 모든 브라우저, 모든 Mac·Windows에 들어 있다. 그러나 그 사용성의 대가로 네 가지 제약을 들고 다닌다.① 단일 라이터(single writer) — 어느 순간에도 한 프로세스만이 DB 파일에 쓸 수 있다. WAL 모드로 동시.. 2026. 5. 28.
"Lambda는 부족하고 EKS는 무겁다: Modal이 GPU 인프라를 혁신하는 방법" 1. Modal 기술이란?1-1. 왜 필요한가 — 기존 방식의 한계2023년 LLM 폭발 이후, AI 워크로드는 세 가지 동시 요구를 던지기 시작했습니다.요청당 GPU가 필요하다. 단 한 번의 추론도 A100 또는 H100을 쥐어야 의미 있는 응답 시간이 나옵니다.0에서 수백 컨테이너로 즉시 확장되어야 한다. 콜드 스타트가 분 단위면 사용자가 떠납니다.Python 한 파일로 끝나야 한다. ML 엔지니어는 Dockerfile·Helm chart·Karpenter NodePool을 짜고 싶어 하지 않습니다.기존 솔루션들은 이 셋 중 하나 이상을 못 합니다.기존 방식못하는 것AWS LambdaGPU 없음, 15분 제한, 250MB 이미지 제한, 영속 볼륨 없음AWS SageMaker Endpoint콜드 스타트.. 2026. 5. 22.
벤더 락인 방지와 비용 최적화를 위한 LLM 게이트웨이, LiteLLM AI Infra · LLM Gateway · Multi-Provider · OpenAI-Compatible · Routing · Fallback · Spend Guardrail "GPT-4o로 짜둔 코드를 Claude Sonnet으로 옮기는 데 왜 일주일이 걸리지?", "Bedrock·Vertex·Azure가 다 다른 인증 방식과 응답 스키마를 쓴다", "어제 갑자기 OpenAI가 5xx를 토해내는데 Anthropic으로 자동 전환할 방법이 없다", "팀 막내가 실수로 GPT-4 32k에 100만 토큰 프롬프트를 박았는데 Slack 알림조차 없다." 이 네 줄이 2024–2026 모든 LLM 프로덕션 팀의 공통 비명이다. LiteLLM은 정확히 이 자리에 들어온다 — "100+ LLM API의 사실상 .. 2026. 5. 14.
반응형