๐Ÿ“š[๋…ผ๋ฌธ ๋ณด๋Ÿฌ๊ฐ€๊ธฐ](https://arxiv.org/abs/1505.04597) # Abstract - **U-Net**์€ ์ ์€ ์–‘์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ๋„ ๋†’์€ ์ •๋ฐ€๋„์˜ ์„ธ๋ถ„ํ™”๋ฅผ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” **CNN ๊ตฌ์กฐ**์ด๋‹ค. - U-Net์˜ ๋ชฉํ‘œ๋Š” **Classfication**์ด ์•„๋‹ˆ๋ผ **Segmentation**์ด๋‹ค. ์ฆ‰, ๊ฐ ํ”ฝ์…€์ด ์–ด๋–ค ์˜๋ฏธ(ํด๋ž˜์Šค)์— ์†ํ•˜๋Š”๊ฐ€๋ฅผ ํ•™์Šตํ•˜์—ฌ **Mask ์ด๋ฏธ์ง€**๋ฅผ ๊ฒฐ๊ณผ๋ฌผ๋กœ ๋ฐ˜ํ™˜ํ•œ๋‹ค. (Ex, ์„ธํฌ ์„ธ๋ถ„ํ™”, ๋‡Œ MRI ์˜์—ญ ๊ตฌ๋ถ„, ๋„๋กœ ์ฐจ์„  ํƒ์ง€ etc..) - ๊ธฐ์กด์˜ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์€ ์ˆ˜์ฒœ~์ˆ˜๋งŒ ์žฅ์˜ ๋ผ๋ฒจ๋ง๋œ ์ด๋ฏธ์ง€๋ฅผ ์š”๊ตฌํ•˜์ง€๋งŒ, ์˜ํ•™ ์˜์ƒ ๊ฐ™์€ ๋ถ„์•ผ์—์„œ๋Š” ๋งŽ์€ ๋ฐ์ดํ„ฐ ํ™•๋ณด๊ฐ€ ๊ฑฐ์˜ ๋ถˆ๊ฐ€๋Šฅํ•˜๊ธฐ ๋•Œ๋ฌธ์— U-Net์€ **๋ฐ์ดํ„ฐ ์ฆ๊ฐ•**์„ ๊ฐ•ํ•˜๊ฒŒ ํ™œ์šฉํ•ด **์ œํ•œ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ•™์Šต**ํ•˜๋„๋ก ์„ค๊ณ„๋˜์—ˆ๋‹ค. - U-Net์€ ์ปจํ…์ŠคํŠธ(context)๋ฅผ ํฌ์ฐฉํ•˜๋Š” **Contracting path(์ˆ˜์ถ• ๊ฒฝ๋กœ)์™€** ํ”ฝ์…€ ๋‹จ์œ„์˜ ์ •ํ™•ํ•œ ์œ„์น˜๋ฅผ ๋ณต์›ํ•˜๋Š” **Expanding Path(ํ™•์žฅ ๊ฒฝ๋กœ)๋กœ** ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค. - ์ถ”๊ฐ€๋กœ 512 x 512 ์ด๋ฏธ์ง€ ํ•œ ์žฅ์„ GPU์—์„œ 1์ดˆ ์ด๋‚ด์— ๋ถ„ํ• ํ•  ์ˆ˜ ์žˆ๋‹ค. - U-Net์€ ISBI 2015 Cell Tracking Challenge์—์„œ 1๋“ฑ์„ ๋‹ฌ์„ฑํ–ˆ๋‹ค. # 1. Introduction - ๊ธฐ์กด Deep CNN์˜ ๊ฒฝ์šฐ ์ด๋ฏธ์ง€ Classfication ๋ถ„์•ผ์— ํฐ ์„ฑ์žฅ์„ ์ด๋ฃจ์—ˆ์œผ๋‚˜, ์ด๋Š” **์ˆ˜์‹ญ๋งŒ~์ˆ˜๋ฐฑ๋งŒ ๊ฐœ์˜ ๋ผ๋ฒจ๋œ ์ด๋ฏธ์ง€**์™€ **๋Œ€๊ทœ๋ชจ ๋„คํŠธ์›Œํฌ ๊ตฌ์กฐ** ๋•Œ๋ฌธ์ด์—ˆ๋‹ค. - ํ•˜์ง€๋งŒ ์ด๋Ÿฌํ•œ CNN์€ ์˜๋ฃŒ ์˜์ƒ์ฒ˜๋Ÿผ **๋ฐ์ดํ„ฐ๊ฐ€ ์ ์€ ๋ถ„์•ผ**์—๋Š” ๋ถ€์ ํ•ฉํ•˜๋‹ค. - ์ผ๋ฐ˜ CNN์˜ ๋ชฉํ‘œ๋Š” Classfication์ธ ๋ฐ˜ํ•ด U-Net์˜ ๋ชฉํ‘œ๋Š” Segmentation(์„ธ๋ถ„ํ™”)์ด๋‹ค. - ๊ธฐ์กด์—๋Š” Segmentation์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ ์œ„ํ•ด **sliding window** ๋ฐฉ์‹์„ ์‚ฌ์šฉํ–ˆ๋‹ค. - **sliding window** : ๊ฐ ํ”ฝ์…€ ์ฃผ๋ณ€์˜ ์ž‘์€ ํŒจ์น˜(patch)๋ฅผ ์ž˜๋ผ CNN์— ์ž…๋ ฅํ•˜์—ฌ ๊ทธ ํŒจ์น˜์˜ ์ค‘์‹ฌ ํ”ฝ์…€์ด ์–ด๋–ค ํด๋ž˜์Šค์ธ์ง€ ์˜ˆ์ธกํ•˜๋Š” ๋ฐฉ๋ฒ• - ํ•˜์ง€๋งŒ **sliding window** ๋ฐฉ์‹์—๋Š” **๋‘ ๊ฐ€์ง€ ํฐ ๋ฌธ์ œ์ **์ด ์žˆ์—ˆ๋‹ค. 1. **Ineffciency** : ๋ชจ๋“  ํ”ฝ์…€๋งˆ๋‹ค ๋„คํŠธ์›Œํฌ๋ฅผ ๋”ฐ๋กœ ๋Œ๋ ค์•ผ ํ•˜๋ฏ€๋กœ ์ค‘๋ณต ๊ณ„์‚ฐ์ด ๋งŽ์Œ 2. **Localization โ†” Context** Trade-off : ํฐ Patch๋ฅผ ์“ฐ๋ฉด ์ฃผ๋ณ€ Context๋Š” ์ž˜ ๋ณด์ง€๋งŒ ๊ฒฝ๊ณ„๊ฐ€ ํ๋ฆฟํ•ด์ง€๊ณ  ์ž‘์€ ํŒจ์น˜๋ฅผ ์“ฐ๋ฉด ๊ฒฝ๊ณ„๋Š” ์ž˜ ์žก์ง€๋งŒ ์ „์ฒด ๋งฅ๋ฝ์„ ๋ณด์ง€ ์•Š๋Š”๋‹ค. ์ฆ‰, **์ •ํ™•ํ•œ ์œ„**์น˜์™€ **๋„“์€ ๋ฌธ๋งฅ ์ •๋ณด**๋ฅผ ๋™์‹œ์— ์–ป๊ธฐ ์–ด๋ ต๋‹ค. - **U-Net**์€ **Fully Convolutional Network(FCN) ๊ฐœ๋…**์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์„ค๊ณ„ ๋˜์—ˆ๋‹ค. - ๊ธฐ์กด CNN์€ FC Layer์„ ์‚ฌ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์— feature map์„ **๋ชจ๋‘ flatten** ํ•ด๋ฒ„๋ฆฌ๋Š” ๊ณผ์ •์—์„œ (x, y) ์œ„์น˜ ์ •๋ณด๊ฐ€ ์‚ฌ๋ผ์ง€๋Š” ๋ฌธ์ œ๊ฐ€ ์ƒ๊ธด๋‹ค. - FC Layer๋ฅผ ์ œ๊ฑฐํ•˜๊ณ  ๋ชจ๋“  ์ธต์„ Convolution๊ณผ Upsampling์œผ๋กœ ๋Œ€์ฒดํ–ˆ๋‹ค. ![[U-Net architecture.png]] - U-Net architecture์€ ์ด๋ฆ„ ๊ทธ๋Œ€๋กœ ๋Œ€์นญ ๊ตฌ์กฐ(U-ํ˜•)์ด๋‹ค. - ์™ผ์ชฝ - **Contracting path** : downsampling์œผ๋กœ **context ์ถ”์ถœ** - ์˜ค๋ฅธ์ชฝ - **Expanding path** : upsampling์œผ๋กœ **localization ๋ณต์›** - ๋‘ ๊ฒฝ๋กœ๋ฅผ **skip connection**์œผ๋กœ ์—ฐ๊ฒฐํ•˜์—ฌ ์ €์ˆ˜์ค€ featrue์„ ๋‹ค์‹œ ํ•ฉ์ณ **๊ฒฝ๊ณ„ ์„ธ๋ถ€ ์ •๋ณด ์†์‹ค**์„ ๋ฐฉ์ง€ํ–ˆ๋‹ค. - ๊ธฐ์กด **FNC**๋Š” upsamplingํ•˜๋ฉด์„œ ์ฑ„๋„ ์ˆ˜๋ฅผ ์ค„์˜€๊ธฐ ๋•Œ๋ฌธ์— context๊ฐ€ ์•ฝํ•ด์กŒ์ง€๋งŒ, U-Net์€ **์ฑ„๋„์„ ํ’๋ถ€ํ•˜๊ฒŒ ์œ ์ง€**ํ•ด์„œ **๋ฌธ๋งฅ(context) + ์„ธ๋ถ€(localizatoin)์„** ํ•จ๊ป˜ ์ „๋‹ฌํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. - **Elastic deformation augmentation(ํƒ„์„ฑ ๋ณ€ํ˜• ์ฆ๊ฐ•)์„** ์ ๊ทน ์‚ฌ์šฉํ•˜์—ฌ ์ ์€ ์ˆ˜์˜ ๋ผ๋ฒจ๋ง ๋ฐ์ดํ„ฐ๋กœ๋„ ํ•™์Šต ๊ฐ€๋Šฅํ•˜๊ฒŒ ์„ค๊ณ„ํ–ˆ๋‹ค. - ํ•˜์ง€๋งŒ ์„œ๋กœ ๋งž๋‹ฟ์€ ์„ธํฌ๋“ค์€ ๊ฐ™์€ ํด๋ž˜์Šค๋ผ์„œ ๊ตฌ๋ถ„ํ•˜๊ธฐ ์–ด๋ ต๋‹ค. ๊ทธ๋ž˜์„œ **๊ฒฝ๊ณ„(background border)์— ๋” ํฐ ๊ฐ€์ค‘์น˜๋ฅผ ์ค˜์„œ** ๋„คํŠธ์›Œํฌ๊ฐ€ **'์—ฌ๊ธฐ๊ฐ€ ์„ธํฌ ๊ฒฝ๊ณ„๋‹ค'๋ฅผ** ๋” ๊ฐ•ํ•˜๊ฒŒ ํ•™์Šตํ•˜๋„๋ก ์œ ๋„ํ–ˆ๋‹ค. # 2. Network Architecture # 3. Training # 4. Experiments # 5. Conclusion