장기 여행객을 위한 지자체의 노력은 합리적인가?
– 여행 리뷰 데이터로 알아보는 장기 여행객 사로잡는 법 –
제주도나 강원도 같이 자연경관이 아름다운 곳에서 한 달 살기를 시도하는 사람들이 늘고 있다. 이들은 관광을 넘어 지역 사회에서 오랜 시간 머물며 현지 생활을 체험하고 휴식하는 특별한 경험을 추구한다. 이런 형태의 장기 여행은 새로운 트렌드로 자리잡았으며, 지자체에서도 지역의 우수한 관광자원을 알리고 지역경제를 활성화하고자 숙박비와 체험비를 지원해주는 프로그램을 운영한다. 경남 고성은 경남지역 외 거주자를 대상으로 하루에 한 개 이상의 SNS 홍보 게시물을 업로드하는 조건으로 숙박비와 체험비를 지원하는 프로그램을 운영하고 있다. 그 외에도 전라도 17개 지역도 국내 한 달 살기 지원 프로그램을 통해 장기 여행객들을 끌어 모으고 있다.
그렇다면, 장기 체류 관광객들의 만족도를 높이기 위해서 어떤 요소가 필요할까? 2024년 3월 김희웅 교수(연세대학교 정보대학원)가 발표한 논문 “Unravelling Long-Stay Tourist Experiences and Satisfaction: Text Mining and Deep Learning Approaches”를 통해 그 해답에 다가갈 수 있다. 이 논문은 장기 여행객의 온라인 리뷰를 텍스트 마이닝하여 10가지 경험 차원으로 구체화하고 감정 분석을 수행했다. 또한 어떤 요소가 만족도에 영향을 주는지 밝혀내기 위해 회귀 모델을 사용한 계량경제 분석을 진행했다.
경험 차원을 구체화하기 위한 텍스트 마이닝은 GSDMM을 사용하였다. 여행 리뷰 분석 같은 소비자 경험 분석 시 일반적으로 사용하는 방법론은 Latent Dirichlet Allocation(LDA) model이다. 하지만 이 연구는 데이터의 크기가 그다지 크지 않으며 리뷰 단위가 아닌 리뷰 내 문장 단위로 데이터 분석을 진행한다는 점에서 GSDMM이 더 좋은 성능을 낼 것으로 기대했다. 이 모델을 통해 장기 여행객들의 온라인 리뷰 10개 차원으로 구체화한 결과, ‘1. 호스트와의 상호작용, 2. 이웃 환경, 3. 휴식과 치유, 4. 환대 행동, 5. 관광 명소, 6. 유틸리티 사용 및 요금, 7. 객실 시설 및 편의 시설, 8. 위치(숙소의 위치나 접근성), 9. 청결도, 10. 여행 중 함께하는 사람과의 상호작용’로 나타났다.
장기 여행자들이 관광지에서 받는 자극이 그들의 생각, 감정, 행동에 어떤 영향을 미치는지 알고자 Experiencescape model을 통해 10개의 경험 차원을 5가지 요소에 연결 짓는 분석이 이루어졌다. 5가지 요소에는 감각적 요소(시각, 청각, 후각 등 감각적으로 관광객이 경험하는 것들)와 자연적 요소(자연 환경이나 풍경과의 상호작용) 등이 포함되어 있다. 이를 통해 경험 차원을 좀 더 구체적인 요소로 범주화할 수 있다. 아래와 같이 연결됨을 알 수 있다.
대부분의 차원들이 잘 연결되지만, ‘유틸리티 사용 및 요금(Utility usage and bill)’은 기존 모델의 어떤 요소와도 연결되지 않는 결과가 나왔다. 이 차원은 전기, 물, 가스와 같은 유틸리티 소비 및 비용과 관련된 경험이다. 기존 모델에서는 확인할 수 없었던 요소이므로 이 차원이 만족도와 어떤 관련이 있는지 이후의 분석에서 주목해볼 필요가 있다.
이어서 10개의 경험 차원에 대해 딥러닝 기반의 감정 분석을 진행했다. 감정 분석에는 한국어 자연어 처리에 특화된 모델인 KoBERT를 사용했다. 이 모델은 단어 하나하나만 분석하는 것이 아니라 문맥적 관계, 문장 구조, 문법적 뉘앙스까지 평가하기 때문에 감정 분석에 적합하다.
이 논문에서는 KoBERT를 훈련하기 위해 숙박시설과 관련된 리뷰를 추가적으로 수집한 후 긍정리뷰, 부정리뷰로 라벨링을 진행했다. 이 데이터를 통해 파인튜닝(fine-tuning)(1) 을 진행한 후, GSDMM으로 분류된 10가지 경험 차원에 대한 감정 수준을 예측했다. 성능은 F1 Score(2) 기준으로 91~92%이며, 비교 모델인 Bi-LSTM 모델을 능가하는 수치이다.
(1) 미리 학습된 AI 모델을 새로운 데이터에 맞게 조금 더 학습시키는 과정.
(2) 정확도와 재현율(얼마나 잘 맞췄는지)을 조화롭게 평가한 점수. 1에 가까울수록 예측이 정확함을 의미.
최종적으로 장기 여행자들의 만족도에 영향을 미치는 요소를 알기 위해 Tobit model을 통해 계량경제 분석을 진행했다. KoBERT의 결과로 나온 감정수준을 독립변수로, 여행객 평점 점수(1점~5점)을 종속변수로 사용했다. 일반적으로 사용되는 회귀 모델은 Ordinary Least Squares(OLS)이지만 이 연구에는 Tobit model이 적합하다. Tobit model은 종속 변수가 특정 값에서 절단되거나 제한될 때 사용되는 통계 모델인데, 이 연구에서 사용된 종속변수 1부터 5까지의 값을 가지는 평점 점수이기 때문이다.
아래의 절차를 걸쳐 분석이 완료되었으며, 장기 여행과 관련된 3가지 중요한 분석을 도출해낼 수 있다.
1. 전기, 물, 가스와 같은 생활 자원의 중요성
주목하기로 했던 새로운 경험 차원인 ‘유틸리티 사용 및 요금(Utility usage and bill)’이 만족도에 유의미한 영향을 미침을 알 수 있다. 전기, 물, 가스 같은 생활요소들은 집을 구할 때 중요하게 고려하는 사항이다. 여행이지만 장기간 머문다는 점에서 이 요소들이 만족도에 영향을 준다고 볼 수 있다.
2. 유명 관광지보다 휴식을 취할 수 있는 장소
장기 여행자들은 여행 초기에는 관광지를 방문하곤 하지만 그 이후에는 활동의 강도를 줄이고 휴식에 더 집중하고자 한다. 장기 여행의 목적이 관광지보다는 휴식과 현지 몰입에 중점을 둔다는 점을 재확인할 수 있는 결과이기도 하다.
3. 지역 호스트의 사회성
호스트와의 상호작용과 환대 행동에 대해 자주 언급했는데, 호스트가 여행객들이 현지인처럼 생활할 수 있도록 돕고 만족스러운 경험을 제공하는 것이 중요한 역할임을 추측할 수 있다.
여행 리뷰 데이터를 분석한 결과는 한 달 살기 프로그램을 운영하는 지자체에게 좋은 참고자료가 될 수 있을 것이다. 프로그램 대부분은 지역 유명 관광지와 전통시장 방문을 권장하며, 숙박비와 체험비를 지원하는 방식으로 운영되고 있다. 분석 결과를 참고한다면 지자체의 지원은 다른 곳을 향해야 한다. 실제 장기 여행객들은 유명 관광지보다 휴식 장소를 선호하고, 편리한 생활 자원이 갖추어진 숙박 시설에 머물며 지역 주민들과 소통하는 것을 기대하기 때문이다. 지자체가 좋은 호스트가 될 수 있는 지역 주민을 섭외하여 여행객들에게 소개해주는 프로그램을 제공한다면 더 많은 장기 여행객을 사로잡을 수 있을 것이다.
* 이 글은 논문의 주요 내용을 간략히 정리한 것으로, 모든 세부 내용을 포함하지 않을 수 있습니다. 더 자세한 사항이나 명확한 내용은 아래의 원문 논문을 참고하시기 바랍니다:
Kim, S. S., Shin, W., & Kim, H. W. (2024). Unravelling long-stay tourist experiences and satisfaction: text mining and deep learning approaches. Current Issues in Tourism, Advance online publication.
https://doi.org/10.1080/13683500.2024.2327840
감수: 연세대학교 바른ICT연구소 노환호 연구교수
박지영
연세대학교 바른ICT연구소 인턴