Econometric Forecasting Using Ubiquitous News Text: Text-enhanced Factor Model

한국은행에서 재미있는 간행물을 내놓았다.

짧게 요약하면, 뉴스 텍스트를 분석하고 그 결과를 응용하여 이를 경제 전망에 활용한다는 내용이다. 해당 내용에 관심있는 이들에게는 유용한 자료이지 싶다.

다음은, 한국은행에서 제공하는 국문 초록과 해당 논문 내용이다.

뉴스 텍스트를 경제 예측에 활용하고자 하는 연구들이 주목받고 있다. 본 논문은 학습 데이터 없이 경제 부문별 서술형 정보를 효과적으로 정량화하여 경제예측에 활용하는 방법을 검토하였다. 본 논문은 경제 도메인별로 나타나는 주어-술어 패턴을 이용하여 ‘테마별 빈도 지수(Theme Frequency Index, TFI)’를 추정하고 이를 통해 경제에 대한 대중의 인식을 측정하였다. 구체적으로 생산, 인플레이션, 고용, 자본 투자, 주식, 주택 가격 등 15개 부문의 TFI를 제시하고 은닉인자 구조에 기반한 ‘텍스트 강화 인자모형 (Text-enhanced Factor Model, TFM)’을 구축하여 서술형 정보를 경제 예측에 반영하였다. 약 1천8백만 건의 뉴스기사를 바탕으로 한 실증분석 결과 TFM은 단기 GDP 예측 정확도를 향상시키는 것으로 나타나며, 이는 도메인 지식을 반영한 텍스트 마이닝 기술이 학습 비용 없이도 정성적 정보를 효과적으로 처리할 수 있음을 보여준다. 본 논문에서 제시한 방법론은 신속하고 효율적이며, 서술형 정보를 이용하기 위한 다양한 경제 부문에서 활용이 가능할 것으로 기대된다.

(붙임 1) BOK경제연구 제2023-10호 본문

댓글 남기기

이 사이트는 스팸을 줄이는 아키스밋을 사용합니다. 댓글이 어떻게 처리되는지 알아보십시오.