AI(Artificial Intelligence)

사람처럼 보고 이해하는 인공지능, 딥뷰(Deep View)에 대해 알아보겠습니다.

forward error correction Circle 2025. 7. 2. 08:22
반응형

인공지능이 이제는 눈을 떴습니다. 텍스트와 음성뿐 아니라 '영상'을 보고 상황을 인지하고, 예측까지 하는 AI 기술이 주목받고 있습니다. 이 글에서는 국내 대표 연구기관 ETRI(한국전자통신연구원)가 개발한 딥뷰(DeepView)의 개념, 기술요소, 활용 사례에 대해 깊이 있게 살펴봅니다.

Ⅰ. 딥뷰(Deep View)의 등장 배경

 인간은 복잡한 상황에서도 직관적으로 사물을 인식하고 행동을 이해합니다. 길거리에서 누군가 쓰레기를 버리면 즉시 인지하고 "이건 불법이다"라고 판단할 수 있습니다. 하지만 기존 영상 처리 기술은 다음의 한계를 가지고 있었습니다:

ⅰ. 정확도 부족: 배경이 복잡하거나 조명이 좋지 않으면 인식률이 급격히 하락
ⅱ. 실시간 분석의 어려움: 영상 데이터는 방대한데 처리 속도는 따라가지 못함
ⅲ. 맥락 파악 불가: 단순 객체 탐지는 가능해도 '왜' 그 행동이 일어났는지는 이해 못함

이러한 문제를 해결하기 위해, 딥러닝의 발전, CCTV 및 IoT 기기의 폭발적 확산, 실시간 대규모 분석 수요 증가가 맞물리면서, ETRI는 "사람처럼 영상 속 상황을 이해하는 AI"를 목표로 딥뷰를 개발하게 됩니다.

Ⅱ. 딥뷰(Deep View)의 등장 배경

ⅰ. 딥뷰(Deep View) 란?

 단순한 객체 인식 기술이 아니라 사람이 사물을 보고, 의미를 해석하고, 다음 행동을 예측하듯, 기계도 영상을 기반으로 상황을 이해할 수 있도록 설계된 시각 기반 인공지능 플랫폼입니다.

ⅱ. 딥뷰(Deep View) 핵심 기능

기능 설명
영상 인식 사람·사물 탐지 및 추적, 관절·포인트 기반 행동 인식
내용 파악 객체 간 의미 관계를 온톨로지 기반으로 추론
실시간 분석 대규모 영상 데이터를 시공간 기준으로 분석하여 위험 예측
안정 분석 인프라 국가 단위 영상 자산화 및 정보 분석 체계 구축


ⅲ. 딥뷰(Deep View) 기술 요소
딥뷰는 아래 두 축의 기술 요소를 기반으로 구성됩니다.

1) 시각 데이터 수집·처리 기반

구성 요소 설명
시각 데이터 뱅크 실시간·대규모 영상 수집을 위한 저장소
비정형 데이터 저장 영상·이미지·오디오 등 비정형 데이터 관리
API & 인터페이스 외부 시스템과의 연동을 위한 변환 및 API 제공
대규모 처리 파이프라인 병렬·분산 처리 워크플로우, 하이브리드 스케줄링 지원

2) 내용 분석·추론 기반

구성 요소 설명
객체·행동 분석 이미지 내 객체 탐지, 행동 인식 (관절·포즈 등)
시각 택소노미 이벤트·행동·객체에 대한 분류체계 (온톨로지 기반)
시멘틱 추론 다중 객체 간 의미 관계 심층 해석
예측형 응용 재난·범죄·산업 이상 등을 사전 탐지 및 대응

Ⅲ. 딥뷰(Deep View) 심화 연구 분야

연구 분야 설명
백본 네트워크 최적화 VoVNet, CenterMask 등 고속·경량 CNN 모델 개발
사람 속성 인식 뉴럴넷 얼굴 표정, 관절 포인트, 옷차림 등 정황 정보 분석
행동 인식 네트워크 RNN, 3D-CNN 등 시간적 연속성 고려한 비디오 이해
지식 기반 시각 추론 온톨로지·그래프 DB를 활용한 의미 추론 및 검색 강화

Ⅳ. 딥뷰(Deep View) 활용 사례

활용 사례 설명
쓰레기 불법 투기 단속 CCTV 분석을 통해 불법 행동을 감지하고 자동 경고 전송
도심 범죄·재난 탐지 이상 행동·군중 밀집 상황을 조기 탐지
제조 품질 검사 공정 내 제품 결함 실시간 감지
의료 영상 분석 CT/MRI 영상에서 병변 자동 탐지 및 진단 보조

 

반응형