Question Answering

IR(Information retrieval, 정보 검색)과 QA(Question Answering)의 큰 차이는,

QA는 specific한 질문에 answer하는 것이고, IR은 general한 질문에 document list를 제공하는 것이다.

최근 즉각적인 answer이 가능한 QA model의 중요성이 커지고 있다.

또한 2015년부터 대량의 dataset(MCTest, ProcessBank, SQAD)들이 생기면서 활발하게 연구되고 있으며

human perfomance를 능가하는 수준의 모델도 있다.


QA는 2가지 단계로 나뉘는데,

  1. 질문에 대한 정답이 있을 것 같은 문서 찾기 (traditional IR)

  2. 찾은 문서들 내에서 정답 찾기 (machine reading comprehension)

    • machine reading comprehension는 기계의 reading ability를 측정해야 한다 .


QA 질문은 아래와 같은 6가지 유형이 있다.

  1. Factoid type question ; what, which, when, who, how를 대답하도록

  2. list type question ; list의 대답을 하도록

  3. confirmation type question; yes/no의 대답

  4. casual question; why, how를 대답하도록

  5. hypothetical question; no specific answers

  • e.g. What would happen if Korea unified?
  1. complex question


QA models

  1. stanford attentive reader

  2. Bi-directional Attention Flow (BidAF)

  3. 기타 등등

이 외에도 dynamic coattention Networks for QA, FusionNet, Google's QANet이나

ELMO, BERT 등을 기반으로 하는 QA model도 많이 생기고 있다


Reference