Dependency Parsing
은 종종 정리했던 건데, 이 강의를 들으면서 추가적으로 알게된 내용들만 따로 정리해야겠당
parsing
이란, 문장의 문법적인 구성 또는 구문을 분석하여 구문분석 트리를 구성하는 것이다.
그 중에서도 문장의 구조를 파악하는 constituency parsing
, 단어간 관계를 파악하기 위한 dependency parsing
으로 나뉜다.
constituency parsing
문장을 중첩된 성분으로 나누어 문장의 구조를 파악하며,
영어와 같이 비교적 어순이 고정적인 언어에서 많이 쓰인다.
dependency parsing
반면 의존분석은 단어간 의존 또는 수식관계를 파악한다.
한국어와 같이 어순이 고정적이지 않으며, 문장성분을 일부 생략 가능한 언어에서 많이 쓰인다.
의존분석이 필요한 이유는, 아래와 같이 특정 단어가 수식하는 대상의 범위가 달라짐에 따라 중의적으로 해석되는 경우가 많기 때문이다.
dependency parsing에는
두 단어의 의존여부를 순서대로 결정하여, 점진적으로 트리를 만드는 trainsition-based
와
가능한 의존관계를 모두 고려한 후 가장 확률이 높은 트리를 선택하는 graph-based
가 있다.
trainsition-based
중에서도 conventional parser
와 neural dependency parser
로 나뉘는데,
최근에는 dense한 feature와 neural network model을 사용하는 neural dependency parser
가 많이 나타나고 있다.