Ⅰ. Hadoop 이란? 오픈소스 분산 컴퓨팅 프레임워크로, 대규모 데이터를 효율적으로 저장하고 처리하는 데 사용됩니다. Apache Software Foundation에서 개발했으며, 확장성과 내결함성을 특징으로 합니다. 특히, 수천 대의 서버로 구성된 클러스터 환경에서 대규모 데이터를 저장하고 병렬로 처리할 수 있도록 설계되었습니다. Ⅱ. Hadoop의 구성 요소 구성 요소 설명특징HDFS (Hadoop Distributed File System)분산 파일 시스템으로 데이터를 여러 노드에 나누어 저장.대용량 데이터 세트를 높은 처리량으로 저장 및 관리.데이터 복제(기본적으로 3개의 복제본 유지)로 내결함성 제공.Write Once, Read Many 방식으로 데이터 추가나 읽기에 최적화.YARN (Y..