- paper : NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis / ECCV2020
NeRF ๋ ผ๋ฌธ์ด ๊ณต๊ฐ๋์ง๋ ์๊ฐ์ด ๊ฝค ํ๋ ๋๋ฐ, 2020 ECCV์์ ๊ณต๊ฐ๋์ ๋๋ง ํด๋ ๊ต์ฅํ ์ ๊ธฐํ๊ณ ํ๊ธฐ์ ์ธ view synthesis ๋ฐฉ๋ฒ์ผ๋ก ๊ด์ฌ์ ๋ฐ์์ง๋ง, ์ฌ๋ฌ ๋จ์ ๋๋ฌธ์ ์ค์ ์๋น์ค์ ์ ์ฉ๋๊ธฐ๋ ์ฝ์ง ์์๋ค.
ํ์ง๋ง, 2023 CVPR์์๋ 2022๋ ์ ๋นํด radiance๋ผ๋ ๋จ์ด์ ์ฌ์ฉ์ด 80% ์ฆ๊ฐํ๊ณ , NeRF์ ๊ฒฝ์ฐ 39% ์ฆ๊ฐํ์ ๋งํผ NeRF๋ ํ๋ฐํ ์ฐ๊ตฌ๋๊ณ ์๋ค. ํนํ ์ด์ ๊ฐ๋ ์ฆ๋ช ์ ๋์ด veiw editing ์ด๋ ๊ฐ์ข application ์ฐ๊ตฌ๊ฐ ์งํ๋๊ณ ์๋ค. ์ฆ NeRF๊ฐ ์ด์ ๊ฐ์ข ์๋น์ค์ ํ์ฉ๋ ๋งํ ์์ค์ผ๋ก ๋ฐ์ ํ๊ณ ์๋ค๋ ๋ป์ด๋ค.
๋๋ถ์ ๋๋ ์ค๋ฌด ๋ฉด์ ๋ณผ๋ ์ ๊น ๊ณต๋ถํ๋ NeRF๋ฅผ ๋ค์ ์ฐพ์๋ณด๊ณ ์๊ธฐ์ ๋ด์ฉ์ ์ ๋ฆฌํด ๋๊ณ ์ ํ๋ค.
NeRF (Neural Radiance Fields)
์ฐ๋ฆฌ๊ฐ ๊ฒ์์ฒ๋ผ ์ด๋ค ๊ฐ์ฒด๋ ์ฌ๋์ ์ด๋ฆฌ ์ ๋ฆฌ 360๋ ๋๋ ค๊ฐ๋ฉฐ ๋ค์ํ ๋ทฐ์์ ๊ด์ธกํ๊ธฐ ์ํด์๋ 2D ์ด๋ฏธ์ง๊ฐ ์๋ 3D ๋ ๋๋ง์ด ํ์ํ๋ค. ์ด๋ฌํ 3D ๋ ๋๋ง ๊ธฐ์ ์๋ ๋ณดํต ์ปฌ๋ฌ๊ฐ ์ ํ์ง mesh ๋๋ point cloud ๋๋ voxel๋ก ์ด๋ฃจ์ด์ง 3D ๋ชจ๋ธ์ด ์ฌ์ฉ๋๋๋ฐ, SFM(Structure From Motion) ๊ธฐ์ ์ ํ์ฉํด ์ค์ ์ธ๊ณ์ ๊ฐ์ฒด๋ฅผ 3D reconstruction(3์ฐจ์ ๋ณต์)ํ์ฌ 3D ๋ชจ๋ธ์ ๋ง๋ค ์ ์๋ค.
NeRF๋ ๋น์ทํ ๊ธฐ์ ๊ฐ์ง๋ง, NeRF๋ ๊ฐ์ฒด์ 3D ๋ชจ๋ธ์ ์์ฑํ๋ ๊ธฐ์ ์ด ์๋๋ผ, ๊ฐ์ฒด๋ฅผ ๋ฐ๋ผ๋ณด๋ ๋ชจ๋ ์ฅ๋ฉด์ ์์ฑํ๋ Novel View Synthesis ๊ธฐ์ ์ด๋ค. ์ฆ, ํน์ ๊ฐ์ฒด๋ ์ฅ๋ฉด์ ์ฌ๋ฌ ๋ทฐ์์ ์ดฌ์ํ ๊ฒฐ๊ณผ๋ก ์ค์ ๋ก ์ดฌ์ํ์ง ์์ ๊ฐ๋์์์ view๋ฅผ ๋ง๋ค์ด๋ด์ด ๋ง์น 3D ๋ ๋๋ง๋ ๊ฒ์ฒ๋ผ ๋ณผ ์ ์๋ ๊ธฐ์ ์ด๋ผ๋ ๋ป์ด๋ค. ๋ํ NeRF๋ ์๋ก์ด ๋ทฐ๋ก ๊ด์ธกํ ๋ ๋ง๋ค MLP ๋คํธ์ํฌ๋ฅผ ์ธํผ๋ฐ์คํ์ฌ ๊ฒฐ๊ณผ๋ฅผ ์์ฑํ๋ ๋ฐฉ์์ด๊ธฐ ๋๋ฌธ์, 3D ํ์ ์ ๋ณด๋ฅผ ๋ฏธ๋ฆฌ ์ ์ฅํ๋ค๊ฐ ๋ณด์ฌ์ฃผ๋ ๋ฐฉ์๊ณผ๋ ๋ค๋ฅด๋ค.
๊ทธ๋์ NeRF๊ฐ ๋ค๋ฅธ 3D ๋ ๋๋ง ๋ฐฉ์๋ค์ ๋นํด ๊ฐ์ง๋ ์ฅ์ ์ด ๋ญ๊น?
์ฐ์ NeRF๋ ์ฐ์์ ์ธ ๊ณต๊ฐ์ ๋ํ ํํ์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ view ์ด๋์ด ์์ฐ์ค๋ฝ๋ค. ๋ํ 3D ๋ชจ๋ธ(mesh, voxel ๋ฑ) ์ ๋ณด๋ฅผ ๊ฐ์ง๊ณ ๊ด์ ๊ณผ ๋ฌผ์ฒด์ ๊ด๊ณ๋ฅผ ๊ณ์ฐํ์ฌ ๋ ๋๋งํ๋ ๊ธฐ์กด ๋ฐฉ์์ ๋นํด ์ ์ฅ ๊ณต๊ฐ์ ๋ํ ๋ถ๋ด์ด ์ ๋ค. (๋ฌผ๋ก NeRF ๋ํ view ์ด๋์ ๋ฐ๋ฅธ ์ฅ๋ฉด์ ํํํ๊ธฐ ์ํด ์ง์์ ์ผ๋ก MLP ์ธํผ๋ฐ์ค๋ฅผ ์์ผ์ผ ํ๋ค)
ํนํ NeRF๋ ์ปฌ๋ฌ๊ฐ ๋ฟ๋ง ์๋๋ผ volume density ๊น์ง ์ถ์ ํ๊ธฐ ๋๋ฌธ์ ๋์ฑ ๋ฆฌ์ผํ ๊ฒฐ๊ณผ๋ฅผ ๋ฝ์๋ด ์ค๋ค.
ํ์ฌ๋ NeRF ๊ฒฐ๊ณผ๋ฅผ 3D mesh ํํ๋ก ๋ณํํ๊ฑฐ๋ editing ํ๋ ๋ฑ ์ฌ๋ฌ ์์ฉ์ด ๊ฐ๋ฅํด์ก๋ค. ๋ํ NeRF ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก NeRF์ ์ฅ์ ์ ์ ์งํ๋ฉด์๋ 3D mesh ๋ชจ๋ธ์ ์์ฑํ๋ ์๋๊ฐ ์ด๋ฃจ์ด์ก๋ค.
NeRF์ ์ ์ฒด์ ์ธ ํ๋ฆ
NeRF์ ์ ์ฒด์ ์ธ ํ๋ฆ์ ์ฌ๋ฌ ๊ฐ๋์์ ์ดฌ์ํ ์ด๋ฏธ์ง๋ค๊ณผ ์นด๋ฉ๋ผ ํ๋ผ๋ฏธํฐ๋ฅผ NeRF ๋ชจ๋ธ์ ์ ๋ ฅํ๋ฉด ์๋ก์ด view๋ค์ ๋ ๋๋ง ํด์ฃผ๋ ์์ฃผ ๊ฐ๋จํด ๋ณด์ด๋ ๊ณผ์ ์ด๋ค. ์คํ์์๋ ์ค์ ๊ฐ์ฒด๋ฅผ ์ดฌ์ํ ๊ฒ์ ์๋๊ณ ๋ธ๋ ๋์์ 3D ๋ชจ๋ธ์ ์บก์ฒํ์ฌ ๋ง๋ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๋ค.
- ์
๋ ฅ ๋ฐ์ดํฐ
- ๋ค์ํ ๊ฐ๋์์ ๊ฐ์ฒด๋ฅผ ์ดฌ์ํ ์ด๋ฏธ์ง (RGB + Mask์ 4์ฑ๋)
- ์นด๋ฉ๋ผ ํ๋ผ๋ฏธํฐ (์นด๋ฉ๋ผ ์์น + ๊ฐ๋)
- ์ถ๋ ฅ ๋ฐ์ดํฐ : ์ ๋ ฅ ์ด๋ฏธ์ง์ ์๋ ์๋ก์ด view
NeRF ์ํคํ ์ฒ
NeRF์ ์ํคํ ์ฒ๋ ์ฌ์ค ํฌ๊ฒ ์ค๋ช ํ ๊ฒ์ด ์์ ์ ๋๋ก ๊ฐ๋จํ MLP ๋ชจ๋ธ์ด๋ค. ์ ๋ ฅ์ผ๋ก๋ ๋ฌผ์ฒด์ 3D ์์น์ ๋ฌผ์ฒด๊ฐ ๋ฐ๋ผ๋ณด๋ ๋ฐฉํฅ์ด ์ฌ์ฉ๋๊ณ , MLP ๊ฒฐ๊ณผ๋ก๋ ํด๋น ์ขํ์์์ RGB ์ปฌ๋ฌ๊ฐ๊ณผ ํฌ๋ช ๋์ ์ญ์๋ผ๊ณ ๋ณผ ์ ์๋ Density๊ฐ ์ถ๋ ฅ๋๋ค.
์ด๋ฌํ ๋ฐฉ์์ด ํน์ ๊ฐ๋์์ ๋ฐ๋ผ๋ณด๋ ํน์ ์์น์ ์ปฌ๋ฌ๊ฐ๊ณผ ํฌ๋ช ๋๋ฅผ ์์ธกํด ์ฃผ๋ ๊ฒ์ด๋ค.
- ์
๋ ฅ
- Spatial location : 3D ๊ณต๊ฐ ์์น ์ ๋ณด (x,y,z)
- Viewing diection : ๋ฌผ์ฒด๊ฐ ๋ฐ๋ผ๋ณด๋ ๋ฐฉํฅ (๐ณ,๐)
- ์ถ๋ ฅ
- RGB : ๋ฌผ์ฒด์ ์ปฌ๋ฌ๊ฐ
- Density(๐) : ํฌ๋ช ๋์ ์ญ์์ธ ๋ฐ๋ ๊ฐ
์ํคํ ์ฒ๋ฅผ ๋ณด๋ฉด ์ฌ์ค ๋ ๋ณ๊ฑฐ ์๋ค. MLP ์ ๋ ฅ๋จ์์ x(์์น ์ ๋ณด(x,y,z))๊ฐ ์ ๋ ฅ๋๊ณ 5๋ฒ ์งธ layer์์ ํ ๋ฒ๋ concatํด์ ์ ๋ ฅ๋๋ค. skip connection์ ์ผ์ข ์ด๋ผ ๋ณผ ์ ์๋ค. ๊ทธ๋ฆฌ๊ณ 9๋ฒ ์งธ layer์์ density(๐)๊ฐ ์ถ๋ ฅ๋๊ณ , ์ฌ๊ธฐ์ ๋ค์ d(๋ฐฉํฅ ์ ๋ณด(๐ณ,๐))๊ฐ ์ ๋ ฅ๋์ด ์ต์ข ์ ์ผ๋ก RGB ๊ฐ์ด ์ถ๋ ฅ๋๋ค.
์ด๋ฌํ ๋ฐฉ์์ ์ฌ์ฉํ๋ ์ด์ ๋ density์ ๊ฒฝ์ฐ ๋ฌผ์ฒด๊ฐ ๊ทธ ์์น์ ์กด์ฌํ๋์ง์ ๋ํ ๊ฐ์ด๋ฏ๋ก ๋ฌผ์ฒด๋ฅผ ๋ฐ๋ผ๋ณด๋ ๊ฐ๋์ ์ ํ ๊ด๊ณ๊ฐ ์์ผ๋ ์์น ์ ๋ณด๋ง์ผ๋ก ์์ธกํ๊ณ , RGB ๊ฐ์ ๊ฒฝ์ฐ ๋ฌผ์ฒด๋ฅผ ๋ฐ๋ผ๋ณด๋ ๊ฐ๋์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ์ ์๊ธฐ ๋๋ฌธ์ ๋ง์ง๋ง layer์์ ๋ฐฉํฅ ์ ๋ณด๋ฅผ ์ถ๊ฐํ์ฌ RGB๋ฅผ ์์ธกํ๋ ๊ฒ์ด๋ค.
๊ฐ๋จํ์ง๋ง ๊ต์ฅํ ๋ฆฌ์ฆ๋๋ธํ ๋ชจ๋ธ ๊ตฌ์กฐ์ธ ๋ฏ ํ๋ค!
๊ทธ๋ฐ๋ฐ 3์ฐจ์์ธ ์์น์ ๋ณด(x,y,z)๊ฐ 60์ฐจ์, 2์ฐจ์์ธ ๋ฐฉํฅ ์ ๋ณด(๐ณ,๐)๊ฐ 24์ฐจ์์ผ๋ก ๋ช ์๋์ด ์๋ค. ์ด์ ๊ฐ ๋ญ๊น? ์ด๋ positional embedding๊ณผ ๊ด๋ จ ์์ผ๋ ์กฐ๊ธ ๋ค์์ ์ดํด๋ณด๋๋ก ํ์.
*NeRF ํ์ต ๋ฐฉ๋ฒ
NeRF ๋ํ supervised learning ๋ฐฉ์์ด๊ธฐ์ ํ์ต์ GT(์ ๋ต ์ ๋ณด)๊ฐ ํ์ํ๋ค. ์ ๋ ฅ ์ด๋ฏธ์ง๊ฐ ์ด๋ฏธ ์ฌ๋ฌ view์์์ ๊ฐ์ฒด์ด๊ธฐ ๋๋ฌธ์ ์ด๋ฏธ ๊ฐ์ง๊ณ ์๋ view๋ฅผ ์์ธกํ๋๋ก ์ธํผ๋ฐ์คํ๊ณ ์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ์ loss ๊ณ์ฐํ์ฌ ํ์ต์ ์งํํ๋ค.
๋ณผ๋ฅจ ๋ ๋๋ง
์ ์ด์ ์ด๋ ๊ฒ ํ์ตํ MLP๋ก ๋ฌด์์ ํ๋ ค๋ ๊ฒ์ธ์ง ์์๋ณด์.
์๋กญ๊ฒ ์์ฑํ๊ณ ํ view์ ๊ฐ์์ ์นด๋ฉ๋ผ ์ค์ฌ์ผ๋ก๋ถํฐ ๊ฐ์ฒด ํฅํด ray๋ฅผ ์ด์ ์ด๋ฌํ ray์์ ์ฌ๋ฌ ํฌ์ธํธ๋ค์ ์ํ๋งํ๊ณ ((a)์์ ray์์ ๊ฒ์์ ์ ๋ค), MLP๋ฅผ ํตํด ํด๋น ์ขํ์ RGB์ density ๊ฐ์ ์์ธกํ๋ค. ์ด ๋ ๊ฐ์ฒด๊ฐ ์๋ ์์น๋ density๊ฐ ๋ฎ๊ฒ ๋์ฌ ๊ฒ์ด๊ณ ๊ฐ์ฒด๊ฐ ์กด์ฌํ๋ ์์น์ density๋ ๋๊ฒ ๋์ฌ ๊ฒ์ด๋ค. ์ด ray์์ ์ํ๋ง๋ ๋ชจ๋ ํฌ์ธํธ๋ค์ RGB, density ๊ฐ์ ๋ค์ ๋ฐ๋ผ๋ณด๋ ์์ ์ผ๋ก projection ์ํค๊ณ ํน์ ์ฐ์ฐ์ ํตํด ์ ์ ํ ์ต์ข ์ปฌ๋ฌ๊ฐ์ ๊ณ์ฐํ๋ค. (ray๊ฐ ์ฒซ ๋ฒ์งธ๋ก ๋ง๋๋ ๊ฐ์ฒด์ ๋ ๋ง์ ๊ฐ์ค์น๊ฐ ์๋๋ก ์ฐ์ฐ)
*์ต์ข ์ปฌ๋ฌ๊ฐ ๊ณ์ฐ ์์ ๊ฐ๋จ ์ค๋ช
์ํ๋ง ํฌ์ธํธ์์์ density์ color๋ฅผ ๊ณฑํ ๊ฐ์ ray๋ฅผ ์ ๊ฐ๊น์ด ์ง์ ๋ถํฐ ๋จผ ์ง์ ๊น์ง ์ ๋ถ์ ํ๋๋ฐ, ์ด ๋ Accumulated transmittance(T(t))๊ฐ ๋ํ ๊ณฑํด์ ธ์๋ ๊ฒ์ ๋ณผ ์ ์๋ค. ์ด๋ ray๊ฐ ํด๋น ํฌ์ธํธ์ ๋๋ฌํ ํ๋ฅ ์ด๊ธฐ ๋๋ฌธ์ ray๊ฐ ์ฒซ ๋ฒ์งธ๋ก ๋ง๋๋ ๊ฐ์ฒด์ color์ ๋ ๋ง์ ๊ฐ์ค์น๋ฅผ ๊ฐ์ง๊ณ ์ต์ข color ๊ฐ์ด ๊ฒฐ์ ๋๋ค๋ ๊ฒ์ ์ ์ ์๋ค~!
*์ดํด๋ฅผ ๋๊ธฐ์ํ ์์์ ์ฒจ๋ถ
NeRF ์ต์ ํ
์์ ์ค๋ช ํ ๋ฐฉ๋ฒ๋ง์ผ๋ก๋ NeRF์ ์ฑ๋ฅ์ด ์ฐ์ํ์ง ์๊ธฐ์ ๋ ผ๋ฌธ์์๋ ๋ ๊ฐ์ง ์ถ๊ฐ์ ์ธ ๋ฐฉ๋ฒ์ ํ์ฉํด์ NeRF์ ์ฑ๋ฅ์ ์ต์ ํํ๋ค.
1. Positional Encoding
Positional Encoding์ high-frequency ์ ๋ณด๋ฅผ ์ ๋ณด์กดํ๊ธฐ ์ํด ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ์ผ๋ก MLP ์ ๋ ฅ์ธ ์์น ์ ๋ณด์ ๋ฐฉํฅ ์ ๋ณด์ ์ ์ฉ๋๋ค. 3์ฐจ์์ธ ์์น ์ ๋ณด์ 2์ฐจ์์ธ ๋ฐฉํฅ ์ ๋ณด๊ฐ ๋๋ฌด ์ ์ฐจ์์ด๊ธฐ์ positional Encoding์ผ๋ก ๊ณ ์ฐจ์์ผ๋ก ์๋ฒ ๋ฉ์์ผ MLP์ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ๊ณ ์ฐจ์ํ ์์ผ์ฃผ๋ ๊ฒ์ด๋ค. (์ ์ฐจ์ ์ ๋ ฅ์ ์ฌ์ฉํ๋ฉด ๊ฒฐ๊ณผ๊ฐ low-frequency์ ์น์ค๋จ)
์... ๊ฒฐ๊ตญ ์ด๊ฒ ๋ฌด์จ ์๋ฏธ๋๋ฉด, ์ด๋ค ๊ฐ์ฒด์ ์ธ๋ฐํ ๋ถ๋ถ์ ์ ํํํ๋ ค๋ฉด ๋ฐ๋ก ์ ํฝ์ ๊ณผ์ ์ฐจ์ด๋ ๋ช ํํ๊ฒ ์ ํํ๋์ผ ํ๋๋ฐ, ๊ทธ๋ฅ (x,y,z) ์ ๋ ฅ์ ์ฌ์ฉํ๊ฒ ๋๋ฉด x ๋ฐฉํฅ์ผ๋ก +0.1 ์ด๋ํ๋ค๊ณ ํ๋ฉด ์ ๋ ฅ ๋ฐ์ดํฐ์ ์ฐจ์ด๊ฐ ๋๋ฌด ์ ๊ธฐ์ ์ด๋ฌํ ์ฐจ์ด๋ฅผ MLP๊ฐ ๋ช ํํ๊ฒ ์ธ์งํ ์ ์๋ค๋ ๊ฒ์ด๋ค. (5,5,5)๋ฅผ ์ ๋ ฅํ์๋๋ (5.1,5,5)๋ฅผ ์ ๋ ฅํ์ ๋ MLP ์ ์ฅ์์๋ ๊ทธ๋์ ๋ญ? ๋ ๊ฐ ์ฐจ์ด ๋ณ๋ก ์๋๋? ๋ผ๊ณ ํ๋ค๋ ๊ฒ. ํ์ง๋ง positional encoding์ ์ฌ์ฉํ๋ฉด ์์น์ ์์ ์ฐจ์ด๋ ๋ ๊ณ ์ฐจ์์ผ๋ก ํํํ ์ ์๊ธฐ์ MLP๊ฐ ์์น์ ์ธ๋ฐํ ์ฐจ์ด๋ฅผ ์ ํ์ตํ ์ ์๋ค๋ ๊ฒ์ด๊ณ ๊ทธ๋ ๊ธฐ์ high-frequency๋ฅผ ์ ์ ์งํ๊ฒ ๋๋ค๋ ๊ฒ์ด๋ค.
์ ์คํ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด MLP์ ๋ฐฉํฅ ์ ๋ณด๋ฅผ ์ฃผ์ ํ์ง ์๋ ๊ฒฝ์ฐ ๋ฐฉํฅ์ ๋ฐ๋ฅธ ์ปฌ๋ฌ ์ฐจ์ด๋ฅผ ์์ธกํ ์ ์๊ธฐ ๋๋ฌธ์ ๋ฐ์ฌ๊ฐ ์ผ์ด๋๋ ๋ถ๋ถ์ด ํํ๋์ง ์๊ณ , positional encoding์ ์ฌ์ฉํ์ง ์๋ ๊ฒฝ์ฐ์ high-frequency ์ ๋ณด๊ฐ ๋ง์ด ์์ค๋์ด ์ธ๋ฐํ ๋ถ๋ถ์ด ์ ํํ๋์ง ์๋๋ค๋ ๊ฒ์ ๋ณผ ์ ์๋ค.
2. Hierarchical Sampling
ray ์์์ ํฌ์ธํธ๋ฅผ ์ด๋ป๊ฒ ์ํ๋งํ๋์ง๋ ์ฑ๋ฅ์ ์ํฅ์ ๋ผ์น๋๋ฐ, ๋จ์ํ ์ผ์ ๊ฐ๊ฒฉ์ผ๋ก ์ํ๋งํ๋ ๊ฒฝ์ฐ์๋ ๋์ผํ ์์น์ ์ํ ํฌ์ธํธ๋ง ํ์ตํ๊ธฐ ๋๋ฌธ์ ์ข์ ์ฑ๋ฅ์ ๊ธฐ๋ํ๊ธฐ ์ด๋ ต๋ค. ๋๋ฌธ์ ์ผ์ข ์ ๋๋ค ์ํ๋ง์ธ strtified sampling์ ์ฌ์ฉํ์ฌ ๊ฐ bin ๋ง๋ค ์ผ์ ๊ฐ๊ฒฉ์ผ๋ก ์ํ๋ง์ ํ์ง๋ง, bin ๋ด์์๋ ๋๋คํ๊ฒ ์ํ ํฌ์ธํธ๋ฅผ ์์ฑํ๋ค.
๋ํ ๊ธฐ๋ณธ์ ์ธ ๊ณผ์ ์ธ coarse ์ํ๋ง ์ดํ fine ์ํ๋ง ๊ณผ์ ์์ density๊ฐ ๋์ ๊ณณ์์๋ ์ํ๋ง์ ๋ ๋ง์ด ์ํํ์ฌ ์ถ๊ฐ ํ์ต์ ์งํํ๋ค.
NeRF ๊ฒฐ๊ณผ๋ ์ด๋ฏธ์ง๋ณด๋ค๋ ์์์ด๋ ๋ฐ๋ชจ๋ก ํ์ธํ๋ ๊ฒ์ด ๋ ์ข๊ธฐ์ ์ต๊ทผ NVIDIA์์ ๊ณต๊ฐํ Instant NeRF๋ก ์ ์๋ ์์์ ์๊ฐํ๋ฉฐ ์ค๋ช ์ ๋ง์น๊ณ ์ ํ๋ค.
NeRF์ ๊ธฐ๋ณธ ๊ฐ๋ ๊ณผ ์๋ฆฌ์ ๋ํด ์์ ๋ณด์๋๋ฐ, ์ด๊ธฐ NeRF๋ ๊ฐ์ฒด๋ณ ํ์ต์ ํด์ผ ํ๋ ๋ถ๋ด๊ณผ view๋ณ ์ธํผ๋ฐ์ค ์๊ฐ ๋ฑ ์ฌ๋ฌ๊ฐ์ง ์ ์ฝ์ด ๋ง์๋ค. ์์ง๊น์ง๋ ํด๊ฒฐ๋์ง ์์ ๋ถ๋ถ๋ค์ ๋ง์ง๋ง ์ ์ ๊ฐ์ ๋์ด ๊ฐ๊ณ ์๋ ์ถ์ธ์ด๊ธฐ์, ์กฐ๋ง๊ฐ ์ฌ๋ฌ ์๋น์ค์์ NeRF๋ฅผ ๋ง๋๋ณผ ์ ์์ง ์์๊น ์๊ฐํด ๋ณธ๋ค.