반응형 Trino2 데이터 레이크의 표준 페더레이션 SQL 쿼리 엔진, Trino 분석 Ⅰ. Trino 란? Trino는 2012년 Facebook(현 Meta)에서 페타바이트(PB)급 데이터 웨어하우스 분석을 위해 시작된 PrestoDB를 모태로 하여, 2020년 12월 원조 창립자(Martin Traverso, Dain Sundstrom, David Phillips, Eric Hwang)가 분리·재명명한 분산형 ANSI SQL 쿼리 엔진(Distributed SQL Query Engine)입니다. 단일 SQL 한 줄로 HDFS·S3·MinIO·Hive·Iceberg·Delta Lake·Hudi·MySQL·PostgreSQL·Oracle·Kafka·MongoDB·Elasticsearch·Cassandra·Redis 등 50여 종의 이기종(Heterogeneous) 데이터 소스를 동시에 조.. 2026. 5. 12. 왜 PrestoSQL이 Trino가 되었을까? 특징부터 기본 실행까지 총 정리 Ⅰ. Trino 란? Trino (구 PrestoSQL) 는 페이스북에서 개발한 오픈소스 분산 SQL 쿼리 엔진입니다. 핵심 철학은 단 하나 데이터를 옮기지 않고 그 자리에서 바로 쿼리한다는 것입니다. S3, HDFS, MySQL, PostgreSQL, Kafka, Hive 등 어떤 저장소에 있든 표준 SQL로 즉시 분석할 수 있습니다. 이를 Federated Query(연합 쿼리)라고 부릅니다. ETL로 데이터를 한 곳에 모으는 기존 방식과 달리, Trino는 여러 데이터 소스를 하나의 SQL 문으로 동시에 JOIN할 수 있습니다. 기존 방식(ETL 파이프라인) Trino 방식 (Federated Query)데이터를 중앙으로 이동 후 분석데이터 이동 없이 원본에서 직접 쿼리이동 시간 + 스토리지 비용 .. 2026. 4. 30. 이전 1 다음 반응형