Review: MONO-SLAM
Davison, A. J., Reid, I. D., Molton, N. D., & Stasse, O. (2007). MonoSLAM: Real-time single camera SLAM. IEEE transactions on pattern analysis and machine intelligence, 29(6), 1052-1067.
0. Introduction
์ง๋ 10๋ ๋์ SLAM์ ํฌํจํ ์์จ์ฃผํ ๋ก๋ด ๋ด๋น๊ฒ์ด์ ๋ถ์ผ๊ฐ ์๋นํ ์ง์ ์ ๋ณด์๋ค. ํ์ง๋ง ์นด๋ฉ๋ผ ๋น์ ์ฐ๊ตฌ ๋ํ ๊ฐ์ด ์งํ๋์์๋ ์ฐ์ฐ ๋ถํ ๋ฑ์ ๋ฌธ์ ๋ก ๋ ์ด์ ๋ ์๋์ ๊ฐ์ ๋ค๋ฅธ ์ผ์์์ ๋ ๋ง์ ์ฐ๊ตฌ๊ฐ ์งํ ๋์๋ค.
์นด๋ฉ๋ผ๋ ์ง๊ด์ ์ด๋ฉฐ ์ ํํ๊ณ ์ ๋ ดํ๋ฉฐ, ์๋ค. ์ด๋ฌํ ์ฅ์ ์๋ ๋ถ๊ตฌํ๊ณ ์นด๋ฉ๋ผ๋ photometric ํจ๊ณผ๋ฅผ ํตํด indirectlyํ๊ฒ ์ธ๊ณ์ geometry๋ฅผ ์ธก์ ํ๊ณ sparseํ feature set๋ฅผ real-time์ผ๋ก ๊ตฌํํ๋๋ฐ ๋ช ํํ ํ๊ณ์ ์ด ์์๋ค.
์ด ๋ ผ๋ฌธ์์๋ ๊ณ ์ ํ๋ ์(30Hz)์ real-time ์ฑ๋ฅ ๊ตฌํ์ ๋ชฉํ๋ก ํ๊ณ ์๋ค. ์ด ์์คํ ์์ real-time ์๊ณ ๋ฆฌ์ฆ์ dynamic world์ ๋ค๋ฅธ ๊ตฌ์ฑ ์์๋ฅผ ํฌํจํ๋ loop์ ์ผ๋ถ๋ก ์ฌ์ฉ๋๋ ๊ฒฝ์ฐ์๋ง ์ฐ์ธ๋ค.
dynamic world์ ๋ค๋ฅธ ๊ตฌ์ฑ ์์?
๋ค์ ๋์ ๋จ๊ณ๋ฅผ ์ ์ด ํด์ผ ํ๋ ๋ก๋ด, ๋์์ ๋ํ visual feedback์ด ํ์ํ ์ฌ๋ ๋๋ ๋ค๋ฅธ ์ฌ๋์ ์ ๋ ฅ์ ๊ธฐ๋ค๋ฆฌ๋ ๊ณ์ฐ ๊ณผ์ ๋ฑ
์ด๋ฌํ ๊ฒฝ์ฐ, ์ค์๊ฐ์ผ๋ก ์์ง์ด๋ ์นด๋ฉ๋ผ์์ ์ป์ ์ ์๋ ๊ฐ์ฅ ์ฆ๊ฐ์ ์ด๊ณ ์ธ๋ชจ์๋ ์ ๋ณด๋ ์ธ์ธํ๊ฒ ์์ฑ๋ '์ต์ข ๊ฒฐ๊ณผ ๋งต'์ด ์๋๋ผ, '์ด๋์ ์๋์ง'์ด๋ค. localization๊ณผ mapping์ ๋ณต์ํ๊ฒ ๊ฒฐํฉ๋์ด ์์ผ๋ฉฐ, ๊ธฐ์กด SLAM ์ฐ๊ตฌ๋ฅผ ํตํด ๋ ๊ด๊ณ๊ฐ ์ ๊ธฐ์ ์ด๋ผ๋ ๊ฒ์ด ์๋ ค์ ธ ์์ง๋ง, ์ด ์ฐ๊ตฌ์์๋ localization์ ์ค์ ์ ๋๋ค. map์ ๋ช ํํ ๊ตฌ์ถํ๊ธด ํ์ง๋ง, localization์ ์ํด ์ต์ ํ๋ landmark๋ค๋ก ์ด๋ฃจ์ด์ง sparse map ํํ๋ก ๊ตฌ์ถํ๋ค.
๋ํ real-time ์นด๋ฉ๋ผ tracking ์๋๋ฆฌ์ค์๋ ์ ํ๋ ํ๊ฒฝ์์ extended motion ๋ฐ looping motion์ด ํฌํจ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. (e.g. ํด๋จธ๋ ธ์ด๋๊ฐ ์์ ์ ํ๊ฑฐ๋, ๊ฐ์ ์ฉ ๋ก๋ด์ด ์ง์ ์ฒญ์ํ๋ ๊ฒฝ์ฐ) ground truth๋ก ๋ถํฐ gradual drift๊ฐ ๋ฐ์ํ์ง ์๋ repeatable localization์ ์ด๋ฌํ ๊ณณ์์ ํ์์ ์ด๋ฉฐ, ์์ง์ด๋ ์นด๋ฉ๋ผ๊ฐ ๋์์ค์ง ์๊ณ ๊ณ์ํด์ ์๋ก์ด ์ง์ญ์ ํ์ํ๋ ๊ฒฝ์ฐ๋ณด๋ค ํจ์ฌ ๋ ์ค์ํ๋ค. ์ด๋ฌํ ํ๊ฒฝ์์ ๋ฐ๋ก ์ฐ๋ฆฌ์ fully-probabilistic SLAM ์ ๊ทผ ๋ฐฉ์์ด ๊ทธ ์์ฒด๋ก ์ฐ์ธ๋ค. State-based ํ๋ ์์ํฌ์์ ๋ฌดํํ ์ฐธ์กฐ๋ scene landmark์ persistent map์ ์์ฐ์ค๋ฝ๊ฒ ๊ตฌ์ฑํ๊ณ long-term drift๋ฅผ ์์ ํ๊ธฐ ์ํด loop closure์ ํ์ฉํ๋ค. persistent world map์ ํ์ฑํ๋ค๋ ๊ฒ์ ์นด๋ฉ๋ผ ์์ง์์ด ์ ํ๋ ๊ฒฝ์ฐ ์๊ณ ๋ฆฌ์ฆ์ processing requirement๊ฐ ์ ํ๋๊ณ ์ง์์ ์ธ real-time ์์ ์ด ์ ์ง๋ ์ ์์์ ์๋ฏธํ๋ค. [4]์ ๊ฐ์ tracking ์ ๊ทผ ๋ฐฉ์ ์์๋ ๋์ ๋๋ ๊ณผ๊ฑฐ ํฌ์ฆ์ history์ matchingํ์ฌ loop-closing correction์ ์งํ ํ๋ค.
[5], [6], [7] ํต์ฌ ์์ฝํ์ฌ ์ฐ๊ด ์ง์ ๊ฒ
1. Related Works
๋ณธ ์์ ์์ ๊ทน๋ณตํด์ผ ํ๋ ์ ์ ๊ฐ์ฅ ๋จ์ํ ๊ฒฝ์ฐ SLAM์ ํ์ํ ํ๋์จ์ด๋ฅผ ์ปดํจํฐ์ ์ฐ๊ฒฐ๋ mono ์นด๋ฉ๋ผ๋ก ๋จ์ํํ๊ณ ์ด ์นด๋ฉ๋ผ์ ์์ ๋ก์ด 3D ์์ง์์ ๋ํด ์ต์ํ์ ๊ฐ์ ์ ์๊ตฌํ๋ ๊ฒ์ด๋ค. ๋ช๋ช ์ ์๋ ์ฐ๋ฆฌ์ ๋น์ทํ ๋ชฉ์ ์ ๊ฐ์ง๊ณ ์ค์๊ฐ ์นด๋ฉ๋ผ tracking ์์คํ ์ ์ ์ํ๋ค. McLauchlan๊ณผ Murray [37]๋ sparse information filter framework๋ฅผ ์ฌ์ฉํ์ฌ ์์ง์ด๋ ์นด๋ฉ๋ผ์์ ๋์ ๊ตฌ์กฐ ๋ฐ ๋ชจ์ ๋ณต๊ตฌ๋ฅผ ์ํ Variable State-Dimension Filter๋ฅผ ๋์ ํ์ง๋ง long-term tracking ๋๋ loop closing์ ๋ณด์ฌ์ฃผ์ง ๋ชปํ๋ค.
Chiuso et al. [38]์ ์ฐ๊ตฌ๋ single Extended Kalman Filter๋ฅผ ์ฌ์ฉํ ์ง๋ propagation ๋ฐ localization ๋ถํ์ค์ฑ์ ํฌํจํ์ฌ ์ฐ๋ฆฌ ์์ ๊ณผ ๋ช ๊ฐ์ง ์์ด๋์ด๋ฅผ ๊ณต์ ํ์ง๋ง ์์ ์นด๋ฉ๋ผ ์์ง์์ผ๋ก ์์ ๋ฌผ์ฒด ๊ทธ๋ฃน์ ์ถ์ ํ ๊ฒฐ๊ณผ๋ ์ ํ์ ์ด์๋ค. [38]์ ๋ฐฉ๋ฒ์ simple gradient descent feature tracking์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ high acceleration๋์ feature tracking์ ํ๊ฑฐ๋, periods of neglect ํ์ loop closingํ๋๋ฐ ์ด๋ ค์์ด ์์๋ค.
Nisteยดr et al. [39]๋ ์๊ฐ์ ์ธ ์์ง์์ ์ธ์์ ์ผ๋ก ๋ณต๊ตฌ ํ ์ ์๋ ๋ง์ point feature์ frame to frame ๋งค์นญ์ motion methodology์์ standard structure์ ๊ธฐ๋ฐํ real-time ์์คํ ์ ์ ์ํ๋ค. ์ด๋, point feature๋ค์ ๋ ๋ค์ period of neglect๋ฅผ ๊ฑฐ์น๋ฉด feature๋ฅผ ์ธ์ ํ ์ ์์๊ธฐ ๋๋ฌธ์ AR๋๋ localization์์ ๊ธ๊ฒฉํ drift๊ฐ ์๊ธธ ์ ๋ฐ์ ์๋ค.
[39] ๋ถ์ฐ ์ค๋ช
2. Method
2.1 Probabilistic 3D Map
[11]์ ๊ฐ์ด ์ฐ๋ฆฌ ๋ฐฉ์์ ํต์ฌ ๊ฐ๋ ์ ์นด๋ฉ๋ผ์ state์ ๊ด์ฌ ์์ญ์ ๋ชจ๋ feature๋ค์ ๋ํ current estimates์ snapshot์ ๊ณ์ ๋ํ๋ด๋ probabilistic feature-based map์ด๋ค. ์ด๋ฌํ ์ถ์ , ๋งต์ ์์คํ ์์์ ์ด๊ธฐํ๋๊ณ ์์ ์ด ๋๋ ๋๊น์ง ์ง์๋์ง๋ง Extended Kalman Filter์ ์ํด ์ ๋ฐ์ดํธ๋จ์ ๋ฐ๋ผ continuouslyํ๊ณ dynamicallyํ๊ฒ ๋ฐ๋ฌ๋๋ค. ์นด๋ฉ๋ผ์ feature์ ๋ํ probabilistic state estimates๋ camera motion ๋ฐ feature observation ์ค์ ์ ๋ฐ์ดํธ ๋๋ค. ์๋ก์ด feature๊ฐ ๊ด์ฐฐ๋๋ฉด ์ง๋๋ ์๋ก์ด state๋ก ํ๋๋๋ฉฐ ํ์ํ ๊ฒฝ์ฐ feature๋ฅผ ์ญ์ ํ๋ค.
๋งต์ probabilistic ํน์ฑ์ ์นด๋ฉ๋ผ ๋ฐ feature์ state ํ๊ท "best" estimates ๋ฟ๋ง ์๋๋ผ ์ด๋ฌํ ๊ฐ์์ possible deviations์ ํฌ๊ธฐ๋ฅผ ์ค๋ช ํ๋ 1์ฐจ uncertainty distribution์ ์๊ฐ ๊ฒฝ๊ณผ์ ๋ฐ๋ฅธ propagation์ ์๋ค.
์ด ๋ฌธ์ฅ ์ดํด ์ ๋จ
์ํ์ ์ผ๋ก, ๋งต์ state vector x'์ covariance matrix P๋ก ํํ๋๋ค. State vector x'๋ ์นด๋ฉ๋ผ์ feature์ stacked state estimates๋ก ๊ตฌ์ฑ๋๋ฉฐ P๋ ๋ค์๊ณผ ๊ฐ์ด ๋ถ๋ถ ํ๋ ฌ ์์๋ก ๋ถํ ๋ ์ ์๋ ๋์ผํ ์ฐจ์์ square matrix ์ด๋ค.

์ด๋ ๊ฒ ํด์ ๋ชจ๋ ๋งต parameter์ ๋ํ ํ๋ฅ ๋ถํฌ๋ total state vector ์ฌ์ด์ฆ์ ๋์ผํ ์ฐจ์์์ single multivariate Gaussian distribution์ผ๋ก ๊ทผ์ฌํ๋๋ค.
๋ช ์์ ์ผ๋ก, ์นด๋ฉ๋ผ์ state vector xv๋ ๊ณ ์ ๋ world frame W ๋ฐ ์นด๋ฉ๋ผ๊ฐ ์ ๋ฌํ๋ "Robot" frame R์ ๋ํ metric 3D position vector rW, orientation quaternion qrw, ์๋ ๋ฒกํฐ vw ๋ฐ ๊ฐ์๋ ๋ฒกํฐ wr๋ก ์ด๋ฃจ์ด์ ธ์๋ค.

์ด ๋ ผ๋ฌธ์์ feature state yi๋ point features ์์น์ 3D position vector์ด๋ค. ์นด๋ฉ๋ผ์ feature geometry ๋ฐ coordinate frame์ Fig. 3a.์ ์ ์๋์ด ์๋ค.

๋งต์ ์ญํ ์ ์ ์ฒด ์ฅ๋ฉด ์ค๋ช ์ด ์๋ real-time localization์ด๊ธฐ ๋๋ฌธ์ ์ฐ๋ฆฌ๋ ๊ณ ํ์ง landmarks์ sparse set์ ์ก๋ ๊ฒ์ ๋ชฉํ๋ก ํ๋ค. ์ด๋ ์ฅ๋ฉด์ rigidํ๊ณ , ๊ฐ landmark๊ฐ stationary world feature๋ผ๊ณ ๊ฐ์ ํ๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ๊ฐ landmark๋ 3D ๊ณต๊ฐ์์ localization์ด ์๋ point feature๋ผ๊ณ ๊ฐ์ ํ๋ค. ์นด๋ฉ๋ผ๋ ์์น๋ฅผ ํํํ๊ธฐ ์ํด translation parameter์ rotation parameter๊ฐ ํ์ํ rigid body๋ก ๊ฐ์ ๋๋ฉฐ linear velocity์ angular velocity์ ์ถ์ ์น๋ฅผ ์ ์งํ๋ค. (์ด๊ฒ์ 3.4์ ์์ ์ค๋ช ํ motion dynamics๋ฅผ ์ฌ์ฉํ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ ์๊ณ ๋ฆฌ์ฆ์์ ์ค์ํ๋ค.
๋งต์ Fig. 1a์ ๊ฐ์ด ๊ทธ๋ ค ์ง ์ ์์ผ๋ฉฐ, ๋ชจ๋ geometric estimates๋ ๋ถํ์คํ ๊ฒฝ๊ณ๋ฅผ ๋ํ๋ด๋ ํ์ํ ์์ญ(3๊ฐ์ standard deviations์ ํด๋น)์ผ๋ก ๋๋ฌ ์ธ์ธ ๊ฒ์ผ๋ก ํํ๋๋ค. ํ์ง๋ง, ๊ทธ๋ฆผ 1a๋ ๋ค์ํ ํ์ํ ์์ญ์ด ์ ์ฌ์ ์ผ๋ก ๋ค์ํ ๊ฐ๋์ ์ฐ๊ด๋์ด ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค ์ ์๋ค. : sequential mapping์์ ์ผ๋ฐ์ ์ผ๋ก ๋ฐ์ํ๋ ์ํฉ์ ๊ณต๊ฐ์ ์ผ๋ก ๊ฐ๊น์ด feature๊ฐ ๊ทธ ์ฐจ์ด(์๋์ ์์น)๊ฐ ๊ฝค ์ ํ ์์น ์ถ์ ์น๋ฅผ ๊ฐ์ง์ง๋ง, world ์ขํ๊ณ์ ๋ํ ๊ทธ๋ฃน์ ์์น๋ ๊ทธ๋ ์ง ์๋ ๊ฒฝ์ฐ๊ฐ ์๋ค. ์ด ์ํฉ์ off-diagonal ํ๋ ฌ ๋ธ๋ก์ 0์ด ์๋ ํญ์ ์ํด, ๋งต covariance matrix P์์ ํํ๋๋ฉฐ, ์๊ณ ๋ฆฌ์ฆ์ ์๋์ ์ํด ์์ฐ์ค๋ฝ๊ฒ ๋ฐ์ํ ๊ฒ์ด๋ค.
ํ๋ ฌ์ ์ดํด๋ณด๊ธฐ

๋งต representation์ ์ด ์ฌ์ด์ฆ๋ O(N2)๋ฅผ ๋ฐ๋ฅธ๋ค. ์ฌ๊ธฐ์ N์ feature์ ์์ด๋ฉฐ ์ฐ๋ฆฌ๊ฐ ์ฌ์ฉํ๋ ์ ์ฒด SLAM์๊ณ ๋ฆฌ์ฆ์ O(N2)์ ๋ณต์ก๋๋ฅผ ๊ฐ๋๋ค. ์ฐ๋ฆฌ ์ฐ๊ตฌ์์ real-time์ผ๋ก ๋ค๋ฃฐ ์ ์๋ feature์ ์๋ 30Hz ํ๊ฒฝ์์ ์ฝ 100๊ฐ ์ด๋ค.
์ด ์์ ์์ ๋ค๋ฅธ ํ๋ฅ ์ ํํ์ ์ฌ์ฉํ๋ ๋ณํ์ด ์๋ SLAM์ ๋ํ standard single full covariance EKF ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํ๋ ํฐ ์ด์ ๊ฐ ์๋ค. ์ด ๋ฐฉ์ ๋๋ฌธ์ feature์ ๋ฝ์๋ด๋ ํจํด์ด [22], [25], [34] ๋ฑ๊ณผ ๊ฝค ๋ค๋ฅธ๋ค. ํด๋น ์ฐ๊ตฌ ๋ก๋ด๋ค์ loop ์ฃผ๋ณ์ drift๋ฅผ ์์ ํ๋ ๋จ๊ณ์์ ๋๋ฌผ๊ฒ ์ด์ ์ ๋ณธ ์ฅ์๋ก ๋์์ฌ ๋๊น์ง ํ์ ๊ฒฝ๋ก๋ฅผ ๋ฐ๋ผ ๋ณต๋์ ์ ์ฌํ topologies๋ฅผ ํตํด ์ด๋ํ๋ค. ๋ถํ์คํ pose-to-pose ๋ณํ์ด๋ submap ๋๋ ์ ํํ ์์ ์ ์ฌ์ ์ผ๋ก ๋น์ฝํ ์ด์ฐ trajectory ๊ฐ์ค ์ธํธ์์ ์ ํํ์ฌ ๊ฝค ์ ํํ loop ์ฃผ๋ณ์ ๋ณด์ ํ๋๋ฐ ์์ ๋ฐฉํธ์ผ๋ก ์ฌ์ฉ ํ ์ ์๋ค.
์ฐ๋ฆฌ์ ๊ฒฝ์ฐ, ์นด๋ฉ๋ผ๊ฐ ์ ํ๋ ๊ณต๊ฐ์ ์ค์ฌ์ผ๋ก 3D๋ก ์์ง์ด๊ณ ํ์ ํจ์ ๋ฐ๋ผ ๊ฐ๋ณ feature๋ค์ด ๋ค์ํ ์์๋ก ์์ผ์ ๋ค์ด์๋ค ๋๊ฐ๊ณ ์นด๋ฉ๋ผ๊ฐ ํ์ ํจ์ ๋ฐ๋ผ ๋ค์ํ depth์ ์๋ feature๋ค์ ๋ค์ํ subset์ด ํจ๊ป ํ์๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋ค์ํ ํฌ๊ธฐ์ ์ํธ ์ฐ๊ฒฐ๋ ํจํด loop๋ ์ ๊ธฐ์ ์ผ๋ก close๋๋ค. ์ฐ๋ฆฌ๋ ์ง๋์ ๋ถ๋ถ ๊ฐ์ ์๊ด๊ด๊ณ๋ฅผ ์ ํํ๊ฒ ๋ํ๋ด๊ธธ ์ํ๊ณ , ์๋ ค์ง method์ ํด๋์ค ๋ด์์, single state vector์ covariance matrix ๋ด์์ ์ ์ง๋๋ feature์ sparse map์ ํตํด์ ๊ณ์ฐํ๋ค. 100๊ฐ์ ์ ์ ํ๋ feature๋ค์ ์ง๋๋ฅผ ํ ๋ฐฉ์ ๋งต์ ๊ด๋ฆฌํ๊ธฐ์ ์ถฉ๋ถํ๋ค.
2.2 Natural Visual Landmarks
Last updated
Was this helpful?