한국은행에서 재미있는 간행물을 내놓았다.
짧게 요약하면, 뉴스 텍스트를 분석하고 그 결과를 응용하여 이를 경제 전망에 활용한다는 내용이다. 해당 내용에 관심있는 이들에게는 유용한 자료이지 싶다.
다음은, 한국은행에서 제공하는 국문 초록과 해당 논문 내용이다.
(붙임 1) BOK경제연구 제2023-10호 본문뉴스 텍스트를 경제 예측에 활용하고자 하는 연구들이 주목받고 있다. 본 논문은 학습 데이터 없이 경제 부문별 서술형 정보를 효과적으로 정량화하여 경제예측에 활용하는 방법을 검토하였다. 본 논문은 경제 도메인별로 나타나는 주어-술어 패턴을 이용하여 ‘테마별 빈도 지수(Theme Frequency Index, TFI)’를 추정하고 이를 통해 경제에 대한 대중의 인식을 측정하였다. 구체적으로 생산, 인플레이션, 고용, 자본 투자, 주식, 주택 가격 등 15개 부문의 TFI를 제시하고 은닉인자 구조에 기반한 ‘텍스트 강화 인자모형 (Text-enhanced Factor Model, TFM)’을 구축하여 서술형 정보를 경제 예측에 반영하였다. 약 1천8백만 건의 뉴스기사를 바탕으로 한 실증분석 결과 TFM은 단기 GDP 예측 정확도를 향상시키는 것으로 나타나며, 이는 도메인 지식을 반영한 텍스트 마이닝 기술이 학습 비용 없이도 정성적 정보를 효과적으로 처리할 수 있음을 보여준다. 본 논문에서 제시한 방법론은 신속하고 효율적이며, 서술형 정보를 이용하기 위한 다양한 경제 부문에서 활용이 가능할 것으로 기대된다.