๐[๋
ผ๋ฌธ ๋ณด๋ฌ๊ฐ๊ธฐ](https://arxiv.org/abs/1505.04597)
# Abstract
- **U-Net**์ ์ ์ ์์ ํ์ต ๋ฐ์ดํฐ๋ก๋ ๋์ ์ ๋ฐ๋์ ์ธ๋ถํ๋ฅผ ์ํํ ์ ์๋ **CNN ๊ตฌ์กฐ**์ด๋ค.
- U-Net์ ๋ชฉํ๋ **Classfication**์ด ์๋๋ผ **Segmentation**์ด๋ค. ์ฆ, ๊ฐ ํฝ์
์ด ์ด๋ค ์๋ฏธ(ํด๋์ค)์ ์ํ๋๊ฐ๋ฅผ ํ์ตํ์ฌ **Mask ์ด๋ฏธ์ง**๋ฅผ ๊ฒฐ๊ณผ๋ฌผ๋ก ๋ฐํํ๋ค. (Ex, ์ธํฌ ์ธ๋ถํ, ๋ MRI ์์ญ ๊ตฌ๋ถ, ๋๋ก ์ฐจ์ ํ์ง etc..)
- ๊ธฐ์กด์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์์ฒ~์๋ง ์ฅ์ ๋ผ๋ฒจ๋ง๋ ์ด๋ฏธ์ง๋ฅผ ์๊ตฌํ์ง๋ง, ์ํ ์์ ๊ฐ์ ๋ถ์ผ์์๋ ๋ง์ ๋ฐ์ดํฐ ํ๋ณด๊ฐ ๊ฑฐ์ ๋ถ๊ฐ๋ฅํ๊ธฐ ๋๋ฌธ์ U-Net์ **๋ฐ์ดํฐ ์ฆ๊ฐ**์ ๊ฐํ๊ฒ ํ์ฉํด **์ ํ๋ ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ์ต**ํ๋๋ก ์ค๊ณ๋์๋ค.
- U-Net์ ์ปจํ
์คํธ(context)๋ฅผ ํฌ์ฐฉํ๋ **Contracting path(์์ถ ๊ฒฝ๋ก)์** ํฝ์
๋จ์์ ์ ํํ ์์น๋ฅผ ๋ณต์ํ๋ **Expanding Path(ํ์ฅ ๊ฒฝ๋ก)๋ก** ๊ตฌ์ฑ๋์ด ์๋ค.
- ์ถ๊ฐ๋ก 512 x 512 ์ด๋ฏธ์ง ํ ์ฅ์ GPU์์ 1์ด ์ด๋ด์ ๋ถํ ํ ์ ์๋ค.
- U-Net์ ISBI 2015 Cell Tracking Challenge์์ 1๋ฑ์ ๋ฌ์ฑํ๋ค.
# 1. Introduction
- ๊ธฐ์กด Deep CNN์ ๊ฒฝ์ฐ ์ด๋ฏธ์ง Classfication ๋ถ์ผ์ ํฐ ์ฑ์ฅ์ ์ด๋ฃจ์์ผ๋, ์ด๋ **์์ญ๋ง~์๋ฐฑ๋ง ๊ฐ์ ๋ผ๋ฒจ๋ ์ด๋ฏธ์ง**์ **๋๊ท๋ชจ ๋คํธ์ํฌ ๊ตฌ์กฐ** ๋๋ฌธ์ด์๋ค.
- ํ์ง๋ง ์ด๋ฌํ CNN์ ์๋ฃ ์์์ฒ๋ผ **๋ฐ์ดํฐ๊ฐ ์ ์ ๋ถ์ผ**์๋ ๋ถ์ ํฉํ๋ค.
- ์ผ๋ฐ CNN์ ๋ชฉํ๋ Classfication์ธ ๋ฐํด U-Net์ ๋ชฉํ๋ Segmentation(์ธ๋ถํ)์ด๋ค.
- ๊ธฐ์กด์๋ Segmentation์ ์ํํ๊ธฐ ์ํด **sliding window** ๋ฐฉ์์ ์ฌ์ฉํ๋ค.
- **sliding window** : ๊ฐ ํฝ์
์ฃผ๋ณ์ ์์ ํจ์น(patch)๋ฅผ ์๋ผ CNN์ ์
๋ ฅํ์ฌ ๊ทธ ํจ์น์ ์ค์ฌ ํฝ์
์ด ์ด๋ค ํด๋์ค์ธ์ง ์์ธกํ๋ ๋ฐฉ๋ฒ
- ํ์ง๋ง **sliding window** ๋ฐฉ์์๋ **๋ ๊ฐ์ง ํฐ ๋ฌธ์ ์ **์ด ์์๋ค.
1. **Ineffciency** : ๋ชจ๋ ํฝ์
๋ง๋ค ๋คํธ์ํฌ๋ฅผ ๋ฐ๋ก ๋๋ ค์ผ ํ๋ฏ๋ก ์ค๋ณต ๊ณ์ฐ์ด ๋ง์
2. **Localization โ Context** Trade-off : ํฐ Patch๋ฅผ ์ฐ๋ฉด ์ฃผ๋ณ Context๋ ์ ๋ณด์ง๋ง ๊ฒฝ๊ณ๊ฐ ํ๋ฆฟํด์ง๊ณ ์์ ํจ์น๋ฅผ ์ฐ๋ฉด ๊ฒฝ๊ณ๋ ์ ์ก์ง๋ง ์ ์ฒด ๋งฅ๋ฝ์ ๋ณด์ง ์๋๋ค. ์ฆ, **์ ํํ ์**์น์ **๋์ ๋ฌธ๋งฅ ์ ๋ณด**๋ฅผ ๋์์ ์ป๊ธฐ ์ด๋ ต๋ค.
- **U-Net**์ **Fully Convolutional Network(FCN) ๊ฐ๋
**์ ๊ธฐ๋ฐ์ผ๋ก ์ค๊ณ ๋์๋ค.
- ๊ธฐ์กด CNN์ FC Layer์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ feature map์ **๋ชจ๋ flatten** ํด๋ฒ๋ฆฌ๋ ๊ณผ์ ์์ (x, y) ์์น ์ ๋ณด๊ฐ ์ฌ๋ผ์ง๋ ๋ฌธ์ ๊ฐ ์๊ธด๋ค.
- FC Layer๋ฅผ ์ ๊ฑฐํ๊ณ ๋ชจ๋ ์ธต์ Convolution๊ณผ Upsampling์ผ๋ก ๋์ฒดํ๋ค.
![[U-Net architecture.png]]
- U-Net architecture์ ์ด๋ฆ ๊ทธ๋๋ก ๋์นญ ๊ตฌ์กฐ(U-ํ)์ด๋ค.
- ์ผ์ชฝ - **Contracting path** : downsampling์ผ๋ก **context ์ถ์ถ**
- ์ค๋ฅธ์ชฝ - **Expanding path** : upsampling์ผ๋ก **localization ๋ณต์**
- ๋ ๊ฒฝ๋ก๋ฅผ **skip connection**์ผ๋ก ์ฐ๊ฒฐํ์ฌ ์ ์์ค featrue์ ๋ค์ ํฉ์ณ **๊ฒฝ๊ณ ์ธ๋ถ ์ ๋ณด ์์ค**์ ๋ฐฉ์งํ๋ค.
- ๊ธฐ์กด **FNC**๋ upsamplingํ๋ฉด์ ์ฑ๋ ์๋ฅผ ์ค์๊ธฐ ๋๋ฌธ์ context๊ฐ ์ฝํด์ก์ง๋ง, U-Net์ **์ฑ๋์ ํ๋ถํ๊ฒ ์ ์ง**ํด์ **๋ฌธ๋งฅ(context) + ์ธ๋ถ(localizatoin)์** ํจ๊ป ์ ๋ฌํ ์ ์์๋ค.
- **Elastic deformation augmentation(ํ์ฑ ๋ณํ ์ฆ๊ฐ)์** ์ ๊ทน ์ฌ์ฉํ์ฌ ์ ์ ์์ ๋ผ๋ฒจ๋ง ๋ฐ์ดํฐ๋ก๋ ํ์ต ๊ฐ๋ฅํ๊ฒ ์ค๊ณํ๋ค.
- ํ์ง๋ง ์๋ก ๋ง๋ฟ์ ์ธํฌ๋ค์ ๊ฐ์ ํด๋์ค๋ผ์ ๊ตฌ๋ถํ๊ธฐ ์ด๋ ต๋ค. ๊ทธ๋์ **๊ฒฝ๊ณ(background border)์ ๋ ํฐ ๊ฐ์ค์น๋ฅผ ์ค์** ๋คํธ์ํฌ๊ฐ **'์ฌ๊ธฐ๊ฐ ์ธํฌ ๊ฒฝ๊ณ๋ค'๋ฅผ** ๋ ๊ฐํ๊ฒ ํ์ตํ๋๋ก ์ ๋ํ๋ค.
# 2. Network Architecture
# 3. Training
# 4. Experiments
# 5. Conclusion