SSISO Community

시소당

자연언어처리-파싱 | ◈자연어학◈

파싱이란 문장, 즉 단어의 열을 입력으로 하여 주어진 문법규칙에 따라 입력된 문장의 구조를 밝히는 과정이다. 따라서 입력된 문장에 대한 트리 구조를 구하는 과정이라고 할수 있으며, 이러한 목적의 프로그램을 파서(parser),혹은 구문분석기(syntactic analyzer)라고 부른다.

파싱은 트리구조가 완성되는 진행 방향에 따라 하향식 (top-down)파싱과 상향식(bottom-up)파싱 방법으로 구분한다.

top-down파싱은 트리구조의 최상단을 가리키는 문장 기호 S로 시작하여 이 S를 문법규칙에 의거하여 다시 쓰기를 반복함으로써 단어들의 열인 문장을 얻는 방법이다.

bottom-up파싱은 단어들의 나열로부터 각 단어들을 품사 기호로 변환하고 그중위 일부 연속된 부분을 문법규칙에 의해 결합하여 새로운 기호로 바꾸어 준다.이때 문접규칙의 오른쪽 기호들이 순서대로 결합하여 왼쪽의 기호로 다시 쓰여지게 된다.

모호성(ambiguity)이란 문법 규칙에 따라 문장의 구조를 해석할때 두가지 이상의 다른의미의 구조로 해석될수 있는 성질을 말한다



출처 : http://blog.daum.net/autumn78/8068135

1279 view

4.0 stars