Semantic Segmentation 이란?
- Semantic Segmentation은 Computer Vision을 통해 해결하고자 하는 Task 중 하나이다.
- 간단하게 설명하자면 이미지 내에서 픽셀들을 각각이 내포하고 있는 class로 분류하는 작업을 의미한다.
- Semantic Segmentation Task는 다양한 분야에서 활용되지만 저는 주로 의료 데이터를 통한 segmentation 연구를 진행하고 있습니다.
Traditional method based Semantic Segmentation?
CV 연구 개발 초기에는 thresholding, edge detection 및 region growing과 같은 간단한 휴리스틱 기반 방법으로 시작되었다.
Thresholding
- Thresholding은 가장 단순한 분할 기법이며, Grayscale 또는 Color image를 Binary image로 변환하여 임계값을 통해 이진 분류를 진행한다.
- 일반적으로 Binary image에는 배경과 전경으로 나누어져 있으며 이는 임계값보다 작은 픽셀값을 포함하고 있는 배경과 다른 하나는 임계값 이상인 전경으로 나눌 수 있다.
- Thresholding 기법은 Otsu Thresholding , Adaptive Thresholding 등 다양한 알고리즘을 통해 발전해 왔습니다.
Edge detection
- Edge detection 기법은 이미지에서 물체의 가장자리 또는 경계를 감지하여 물체를 서로 다른 Class로 분리하는 방법이다.
- Edge detection의 핵심은 이미지 Intensity의 불연속성을 감지하는 것이며, 컨벌루션 커널을 이미지에 적용하여 그레디언트 크기를 계산하여 에지를 식별한다.
- 가장 일반적으로 사용되는 Edge detection에는 Sobel, Prewitt 및 Canny 가 포함된다.
Region Growing
- Region Growing기법은 유사한 속성을 가진 픽셀을 연속 영역 또는 개체로 그룹화를 통해 이미지 분할을 진행한다.
- Seed 픽셀 또는 픽셀 집합을 통해 특정 기준을 충족하는 인접 픽셀을 영역에 반복적으로 추가합니다.
- 기준에 만족하지 못하는 픽셀이 존재할 때 까지 프로세스가 계속되는 방식이다.
하지만 이러한 방법들은 CV 분야에서 중요한 역할을 담당하고 있지만, 상대적으로 낮은 성능과 낮은 강건성, 그리고 조명, 관점 및 모양의 변화에 대한 적응력 부족으로 인해 한계점이 존재합니다.
따라서 2010년대를 기점으로 GPU의 발전과 CNN(Convolution Neural Network)의 등장으로 인해 비약적인 성능향상을 기록하고 있습니다. 하지만 딥러닝 기반의 모델들은 데이터의 영향을 많이 타고, 인적 자원이 더 많이 소요될 수 있습니다(라벨링).
→ 즉, 상황에 따라 딥러닝 기반의 모델 보다 전통적인 CV기반의 분할 방법이 성능이 좋을 때도 있다.
오늘은 전통적인 비전기반의 Semantic Setmentation 모델들을 알아보았다. 다음 글부터는 FCN부터 딥러닝 기반의 Semantic Setmentation모델 논문들을 리뷰할 예정이다.
'Review > Paper' 카테고리의 다른 글
Semantic Segmentation(2) - FCN (1) | 2023.05.07 |
---|---|
[Paper Review]Threshold segmentation algorithm (0) | 2022.06.26 |