NER(Named Entity Recognition)
Named Entity Recognition (NER)์ ์์ฐ์ด ์ฒ๋ฆฌ ๊ธฐ์ ์ค ํ๋๋ก, ๋ฌธ์ฅ ๋ด์์ ํน์ ํ ์ ํ์ ๋ช ์นญ(๊ฐ์ฒด)์ ์ธ์ํ๋ ์์ ์ด๋ค. ์๋ฅผ ๋ค์ด, "Steve Jobs๋ Apple์ ์ฐฝ์ ์์ ๋๋ค" ๋ผ๋ ๋ฌธ์ฅ์ด ์๋ค๋ฉด, "Steve Jobs"๋ ์ธ๋ฌผ(person), "Apple"์ ์กฐ์ง(organization)์ด๋ผ๋ ์ ํ์ ๊ฐ์ฒด๋ก ์ธ์๋๋ค. ์ด์ธ์๋ ์ฅ์, ์๊ฐ ๋ฑ ๋ค์ํ ๊ฐ์ฒด๋ฅผ ์ธ์ํ ์ ์๋ค.
์ด๋ฌํ NER์ ์ ๋ณด ์ถ์ถ, ์ง์ ์๋ต, ๋ฆฌ๋ทฐ ๋ถ์, ๊ธฐ๊ณ๋ฒ์ญ ๋ฑ ๋ค์ํ ๊ณณ์์ ํ์ฉ๋ ์ ์๋ค. ์ ํ ์๊ฐํ์ง ๋ชปํ๋ ํ์ฉ์ฒ๋ ๊ธฐ๊ณ๋ฒ์ญ ๋ถ์ผ์ด๋ค. ์์ด๋ฅผ ํ๊ตญ์ด๋ก ๋ฒ์ญํ ๋ ๊ธฐ์ ์ ์ง์นญํ๋ "Apple"์ "์ฌ๊ณผ"๊ฐ ์๋ "์ ํ"๋ก ๋ฒ์ญํด์ผ ํ๋ค. ์ด๋ ๋ฏ ๋ฌธ๋งฅ์ ๋ง๋ ์ฌ๋ฐ๋ฅธ ๋ฒ์ญ์ ์ํด์๋ ๋ฌธ์ฅ์ ์ปจํ ์คํธ ์์์ ๋จ์ด์ ๊ฐ์ฒด๋ช ์ ํ์ ํด์ผ ํ๋ ๊ฒ์ด๋ค.
Pytorch-BERT-CRF-NER
์ถ์ฒํ๋ ๋ ํผ์งํ ๋ฆฌ์์๋ pytorch๋ฅผ ์ฌ์ฉํ์ผ๋ฉฐ SKTBrain์์ ํ๊ตญ์ด๋ก ํ์ต์ํจ BERT ๋ชจ๋ธ์ธ KoBERT ๋ชจ๋ธ์ ํ์ต์ ์ฌ์ฉํ๋ค๊ณ ํ๋ค. NER์ ํ์ฉํ ๊ฐ๋จํ ์์ฉ์ ์ํด์๋ ํ์ต๋ ๋ชจ๋ธ์ ๊ทธ๋๋ก ์ฌ์ฉํด๋ณผ ์๋ ์๋ค.
- ํ๊ตญ์ด NER : https://github.com/eagle705/pytorch-bert-crf-ner
- SKTBrain KoBERT : https://github.com/SKTBrain/KoBERT