본문 바로가기
반응형

전체 글541

Mojo 완벽 정리 - Python superset이자 MLIR 기반 AI 시스템 언어 이 글은 "AI 스택은 왜 10년째 두 언어로 쪼개져 있고, Mojo는 그것을 어떤 아키텍처로 한 언어 안에 합치려 하는가, 그리고 어디까지 쓰고 어디부터는 쓰면 안 되는가"를 한 번에 정리합니다. Mojo는 LLVM·Clang·Swift·MLIR을 만든 Chris Lattner가 Modular Inc.에서 시작한, Python의 superset이자 systems 프로그래밍 언어입니다. Python 문법을 그대로 받되 fn·struct·SIMD[T,N]·borrow 같은 시스템 키워드를 추가해 인터프리터 없이 MLIR로 컴파일하고, GIL이 없으며, GPU 커널을 같은 파일에 같은 문법으로 작성합니다. 즉 PyTorch wrapper(Python) + CUDA kernel(C++) 두 언어로 갈라지던 A.. 2026. 5. 31.
SQLite의 한계를 넘다: libSQL과 Turso가 여는 엣지 분산 데이터베이스의 미래 목차Turso(libSQL)란? — 왜 필요한가, 정의Turso(libSQL)의 특징동작 방식 — 구성 요소와 데이터 흐름구성 및 흐름도 — 단계별 처리설치 방법사용 방법 — 코드/설정과 운영 고려사항자주 쓰는 명령어와 사례활용 방안 — 대안 비교와 "언제 쓰면 안 되는가"1. Turso(libSQL)란? — 왜 필요한가, 그리고 정의왜 필요한가 — SQLite의 90년대식 제약 4가지SQLite는 세상에서 가장 많이 배포된 데이터베이스다. 모든 iOS·Android 앱, 모든 브라우저, 모든 Mac·Windows에 들어 있다. 그러나 그 사용성의 대가로 네 가지 제약을 들고 다닌다.① 단일 라이터(single writer) — 어느 순간에도 한 프로세스만이 DB 파일에 쓸 수 있다. WAL 모드로 동시.. 2026. 5. 28.
"Lambda는 부족하고 EKS는 무겁다: Modal이 GPU 인프라를 혁신하는 방법" 1. Modal 기술이란?1-1. 왜 필요한가 — 기존 방식의 한계2023년 LLM 폭발 이후, AI 워크로드는 세 가지 동시 요구를 던지기 시작했습니다.요청당 GPU가 필요하다. 단 한 번의 추론도 A100 또는 H100을 쥐어야 의미 있는 응답 시간이 나옵니다.0에서 수백 컨테이너로 즉시 확장되어야 한다. 콜드 스타트가 분 단위면 사용자가 떠납니다.Python 한 파일로 끝나야 한다. ML 엔지니어는 Dockerfile·Helm chart·Karpenter NodePool을 짜고 싶어 하지 않습니다.기존 솔루션들은 이 셋 중 하나 이상을 못 합니다.기존 방식못하는 것AWS LambdaGPU 없음, 15분 제한, 250MB 이미지 제한, 영속 볼륨 없음AWS SageMaker Endpoint콜드 스타트.. 2026. 5. 22.
벤더 락인 방지와 비용 최적화를 위한 LLM 게이트웨이, LiteLLM AI Infra · LLM Gateway · Multi-Provider · OpenAI-Compatible · Routing · Fallback · Spend Guardrail "GPT-4o로 짜둔 코드를 Claude Sonnet으로 옮기는 데 왜 일주일이 걸리지?", "Bedrock·Vertex·Azure가 다 다른 인증 방식과 응답 스키마를 쓴다", "어제 갑자기 OpenAI가 5xx를 토해내는데 Anthropic으로 자동 전환할 방법이 없다", "팀 막내가 실수로 GPT-4 32k에 100만 토큰 프롬프트를 박았는데 Slack 알림조차 없다." 이 네 줄이 2024–2026 모든 LLM 프로덕션 팀의 공통 비명이다. LiteLLM은 정확히 이 자리에 들어온다 — "100+ LLM API의 사실상 .. 2026. 5. 14.
실시간 업데이트가 가능한 데이터 레이크하우스의 표준, Apache Hudi 분석 Ⅰ. Apache Hudi 기술이란? 전통적인 데이터 레이크(HDFS, S3 등 객체 스토리지)는 Parquet, ORC와 같은 컬럼형 파일을 단순히 쌓아두는 구조로 설계되었습니다.이러한 구조는 대규모 배치 분석에는 강하지만, 다음과 같은 명확한 한계를 가지고 있습니다. ⅰ. Update / Delete 의 어려움 → 한 건의 행을 수정하려면 파일 전체를 다시 써야 함 (Immutable File System) ⅱ. 실시간성 부재 → 변경 데이터(CDC)를 반영하려면 매번 전체 테이블을 재작성해야 함 ⅲ. 트랜잭션 부재 → 동시에 쓰기/읽기가 일어나면 데이터 정합성을 보장할 수 없음 ⅳ. 작은 파일 문제(Small File Problem) → 스트리밍 적재 시 수많은 작은 파일이 생성되어 쿼리 성능 저하.. 2026. 5. 13.
데이터 레이크의 표준 페더레이션 SQL 쿼리 엔진, Trino 분석 Ⅰ. Trino 란? Trino는 2012년 Facebook(현 Meta)에서 페타바이트(PB)급 데이터 웨어하우스 분석을 위해 시작된 PrestoDB를 모태로 하여, 2020년 12월 원조 창립자(Martin Traverso, Dain Sundstrom, David Phillips, Eric Hwang)가 분리·재명명한 분산형 ANSI SQL 쿼리 엔진(Distributed SQL Query Engine)입니다. 단일 SQL 한 줄로 HDFS·S3·MinIO·Hive·Iceberg·Delta Lake·Hudi·MySQL·PostgreSQL·Oracle·Kafka·MongoDB·Elasticsearch·Cassandra·Redis 등 50여 종의 이기종(Heterogeneous) 데이터 소스를 동시에 조.. 2026. 5. 12.
반응형