반응형 ApacheArrow1 모던 데이터 스택의 공용어, Apache Arrow에 대해 분석 Ⅰ. Apache Arrow 란? Apache Arrow는 2016년 Cloudera·Databricks·Dremio·MapR·Twitter·Salesforce 등 13개 오픈소스 프로젝트(Impala·Cassandra·Drill·HBase·Spark·Kudu·Pandas 등)의 핵심 개발자들이 "시스템마다 데이터를 직렬화(Serialize)·역직렬화(Deserialize)하는 데 전체 CPU의 70~80%를 쓰는 문제"를 해결하기 위해 공동 창립한 언어 중립(Language-Agnostic)·컬럼형(Columnar)·인메모리(In-Memory) 데이터 포맷과 분석 처리 라이브러리 모음입니다. "컴퓨터 메모리에 데이터가 있는 그 모양 그대로(Zero-Copy) 다른 시스템이 읽을 수 있다면, 변환 오버헤.. 2026. 5. 11. 이전 1 다음 반응형