Ⅰ. 서론
1. 연구의 배경 및 필요성
정신건강 문제는 전 세계적으로 주요한 공중보건 과제로 부상하고 있으며, 특히 우울 장애는 가장 높은 유병률을 보이는 정신질환 중 하나로 보고되고 있다(Institute of Health Metrics and Evaluation, 2022). 세계보건기구(World Health Organization; WHO, 2023)는 우울증을 전 세계 질병 부담의 주요 원인 중 하나로 발표하였으며, COVID-19 팬데믹 이후 주요 우울장애는 28 % 이상 증가한 것으로 보고하였다(WHO, 2022). 이러한 정신 건강 문제의 증가는 적절한 개입과 관리의 필요성을 더욱 부각시키고 있다.
국내에서도 학업·취업 등 경쟁 중심의 사회문화와 고립된 개인 생활양식 등의 영향으로 우울증과 자살률이 지속적으로 증가하고 있다(Ministry of Health and Welfare, 2021). 특히 우울은 자살의 주요 위험 요인 중 하나로, 이에 대한 조기 개입은 자살 예방에 있어 핵심적인 전략으로 간주된다(Sung 등, 2024). 그러나 국내 정신건강 인프라는 지역 간 편차가 크고, 정신건강 전문인력은 인구 10만 명당 27명으로 고소득 국가 평균(37명)에 비해 낮은 수준이다(Choi & Kang, 2021; Ministry of Health and Welfare National Center for Mental Health, 2020). 또한, 정신건강 서비스 이용에 대한 사회적 낙인과 문화적 저항감으로 인해 대면 상담 및 치료를 꺼리는 경향이 높다(Park & Lee,2022). 실제로 정신건강 전문가와의 상담 경험이 있는 성인 4명 중 1명은 정신건강 문제를 경험하나, 정신장애로 진단받은 사람 중 12.1 %만 전문가의 도움을 받는 것으로 나타났다(National Center for Mental Health, 2021). 아울러 정신건강 전문가들조차 감정노동과 직무스트레스로 인해 업무 기피 현상이 나타나고 있으며, 이에 따른 전문인력 확보의 어려움도 지속되고 있다(Im 등, 2013; Jang & Kim, 2020).
이러한 상황에서 시간과 장소의 제약 없이 접근 가능한 디지털 기반 정신건강 중재에 대한 요구가 높아지고 있으며(Yeh 등, 2022; Boucher 등, 2021), 특히 인공지능 (AI) 기술을 접목한 챗봇(chatbot)을 활용한 중재가 주목받고 있다. 챗봇은 낙인과 관련된 주제를 다루거나 정신건강 서비스로부터 소외된 계층에게 정보 제공 및 심리적 지원을 제공하기 위해 개발되었으며(Haque & Rubya, 2023), 전통적으로 정신건강 상담을 기피했던 대상자들의 접근성과 참여도를 향상시킬 수 있는 가능성을 내포하고 있다(Yeh 등, 2022). 선행 연구에 따르면, 정신건강 문제가 있는 대상자들이 챗봇을 통해 정보적, 정서적, 실질적, 평가적 지지 등 다양한 형태의 사회적 지원을 경험한 것으로 나타났다(Fortunati & Edwards, 2020). 또한 챗봇은 사용자의 정서적지지 제공, 스트레스 관리, 인지 행동기법 적용, 위기 모니터링 등 다양한 기능을 통해 정신건강 증진을 위한 보조적 수단으로 활용되고 있다(Jiang & Yang, 2025; Kleinau 등, 2024; Ulrich 등, 2024a; Ulrich 등, 2024b). 실제로 Woebot, Wysa, Tess와 같은 챗봇 프로그램은 우울 및 불안 증상 완화에 효과가 있다는 연구 결과들이 보고되고 있다(Fitzpatrick 등, 2017; Fulmer 등, 2018; Inkster 등, 2018).
챗봇의 주요 장점으로는 다음 세 가지가 있다. 첫째, 익명성과 접근성을 기반으로 사회적 낙인이나 심리적 저항 없이 정서적 지지를 받을 수 있는 환경을 제공한다. 둘째, AI 기반 대화 시스템은 사용자에 대한 판단이나 재촉 없이 자기 개방을 촉진하는 특성이 있다. 셋째, 심리치료사의 개입 없이도 24시간 상호작용이 가능하다는 점에서 전통적 대면 상담의 한계를 보완할 수 있다(Lee 등, 2022; Jang & Seo, 2022). 이러한 특성으로 인해 챗봇은 불안, 우울, 스트레스 등 다양한 정신건강 문제 해결을 위한 개입 수단으로 그 적용 범위가 확대되고 있다(Richard 등, 2020).
최근에는 우울 증상 완화를 위한 챗봇 기반 중재 연구가 국내외에서 꾸준히 증가하고 있다. 이는 AI 기술의 발전과 더불어 챗봇이 디지털 기반 정신건강 중재 도구로서 가능성을 보여주고 있음을 시사한다. 쳇봇 중재와 관련된 선행연구들로는 목적에 따라서 우울 및 불안 완화(Karkosz 등, 2024; Kim 등, 2024; Vereschagin 등, 2024; On 등, 2024), 자살위험 평가 및 예방(On 등, 2024), 공황 장애 등 특정 정신질환자 자가관리(Lee 등, 2024), 노인 및 소외 계층 정신건강 관리(Kim 등, 2024), 심리상담 역할(Lee & Lee, 2023)이 연구되고 있다. 그러나 자살 예방을 목표로 한 챗봇 중재 연구는 아직 초기 단계에 머물러 있으며, 그 효과성에 대한 실증적 근거는 매우 제한적이다. 일부 연구에서는 생성형 인공지능 기반 챗봇을 활용하여 학생들이 자살 위험이 있는 우울증 환자를 평가하는 모의 임상 실습을 설계하였고, 해당 챗봇의 적절성, 유용성, 사용성에 대한 긍정적 인식을 보고하였으나, 실제 자살 위험 평가에서 챗봇의 정확도와 신뢰도는 낮은 수준으로 나타나 임상적 활용에는 한계가 있었다(Kwon, 2024). 또 다른 연구에서는 GPT 기반 챗봇과 예측 모델을 결합한 디지털 휴먼 기반 자살 예방 치료제의 개발이 시도되었으나, 실험적 검증이 수행되지 않아 중재 효과의 객관적 입증은 부족한 실정이다(Kim 등, 2024).
이처럼 기존 챗봇 중재 연구는 대상군, 중재 방식, 챗봇의 유형, 평가 지표 등이 상이하여 연구 결과 간 비교가 어렵고, 챗봇 기술의 빠른 발전에 비해 과학적 검증과 근거 기반 평가는 상대적으로 미흡하다. 특히 자살과 같은 고위험 영역에서는 임상적 안정성과 윤리적 고려가 요구되기 때문에, 챗봇을 활용한 효과적인 중재 개발과 그 근거 마련이 더욱 중요하다.
따라서 본 연구는 우울 및 자살 예방을 중심으로 챗봇 기반 정신건강 중재의 효과성을 체계적으로 고찰하고자 한다. 이를 통해 챗봇의 임상적 활용 가능성과 중재 효과를 객관적으로 평가함으로써, 향후 디지털 기반 정신 건강 간호 중재 개발의 방향성을 제시하고, 정신건강 서비스 접근성 향상 및 건강 형평성 제고를 위한 정책적·실무적 기초자료를 제공할 수 있을 것이다.
2. 연구의 목적
본 연구의 목적은 우울 및 자살 예방을 중심으로 한 챗봇 기반 정신건강 중재의 효과성을 체계적으로 고찰함으로써, 디지털 기반 정신건강 중재의 임상적 활용 가능성과 실증적 근거를 제시하고자 함이며, 구체적인 목적은 다음과 같다.
1) 우울 및 자살 예방을 목적으로 한 챗봇 중재의 국내외 연구 동향을 분석한다.
2) 챗봇 중재의 효과성을 평가한 선행연구의 대상자 특성, 중재유형, 평가지표 등을 분석한다.
3) 챗봇 중재의 임상적 효과성과 한계점 및 향후 개선 방향을 도출한다.
4) 디지털 기반 정신건강 서비스 개발을 위한 정책적·실무적 기초자료를 제공한다.
Ⅱ. 연구방법
1. 연구설계
본 연구는 우울 및 자살 예방을 중심으로 한 챗봇 기반 정신건강 중재 연구의 현황 각 중재 방법 및 그 효과를 분석하기 위한 체계적 문헌고찰 연구이다.
2. 문헌검색
1) 문헌고찰 기준 및 지침
본 연구는 코크란 체계적 문헌고찰 매뉴얼(Cochrane handbook for systematic reviews of intervention 6.0)을 바탕으로 하는 한국보건의료연구원(NECA)의 체계적 문헌 고찰 매뉴얼(Kim 등, 2020)과 체계적 문헌고찰 보고기준(preferred reporting items for systematic reviews and meta-analyses; PRISMA)(Page 등 2021)에 따라 시행되었다.
2) 핵심 질문
본 연구의 핵심 질문은 PICO(participants, intervention, comparison, outcomes) 모델을 기반으로 설정하였다.
(1) Participants: 우울 또는 자살 생각을 경험한 일반인, 디지털 기기(챗봇) 사용이 가능한 대상자
(2) Intervention: 우울 증상 완화 또는 자살 예방을 목적으로 챗봇(chatbot), 대화형 에이전트(conversational agent) 등을 활용한 프로그램
(3) Comparison: 비중재나 전통적 방법의 중재, 효과를 평가할 챗봇 외의 중재
(4) Outcomes: 자가보고 및 객관적 평가 자료에 근거한 주요 정신과적 증상 지표(primary outcome)와 더불어 자살예방, 자해, 자살행동, 심리적 지지(psychological support) 등을 포함한 종합적 효과
(5) Study design: 무작위 대조군 실험설계
3) 데이터베이스 및 검색어
본 연구의 자료 검색은 2025년 6월부터 2025년 7월까지 이루어졌으며 문헌검색은 핵심 질문을 선정한 후, 5개의 전자 데이터베이스(KISS, RISS, Pubmed, CINAHL, Web of science core collection)에서 시행했다. 챗봇 기반 정신건강 중재 연구는 2015년 이후 본격적으로 활발히 이루어져 최신 연구 동향을 반영하기 위해 2015년 1월부터 2025년 6월까지 출판된 문헌으로 제한하여 검색하였다. 국내 데이터베이스에서는 ‘챗봇’ 또는 ‘AI 챗봇’ 그리고 ‘우울’ 또는 ‘자살’, ‘자살예방, 자살행동’, ‘중재’ 또는 ‘치료’, ‘프로그램’을 각각 조합하였고, 국외 데이터베이스에서는 ‘chatbot*, conversational agent*, AI chatbot, dialogue system, depression, depressive symptoms, depressive disorder, mood disorder, suicide, suicidal ideation, suicide prevention, self-harm, suicidal behavior, intervention, therapy, treatment, program, psychological support의 키워드를 선정하여 검색하였다. 국외 데이터의 민감도를 높이기 위하여 Mesh(medical subject headings) 용어 및 자유검색어(free-text terms)를 혼합하여 제목, 키워드 및 초록을 검색했다. 또한, 포함된 논문의 참고문헌을 검토하여 추가로 관련 연구를 탐색하는 수동 검색 과정도 수행하였다.
4) 문헌 선정기준과 배제기준
본 연구는 디지털 기반 챗봇(chatbot)을 활용하여 우울 증상 완화 또는 자살생각 및 자살행동 예방을 목적으로 한 무작위 대조군 실험연구(randomized controlled trials)를 대상으로 하였다. 2015년 1월부터 2025년 6월까지 출판된 영어 또는 한국어 논문 중 전문(full-text)을 확보할 수 있는 문헌을 포함하였으며, 연구 대상은 챗봇을 이용할 수 있는 조건을 충족하면 연령, 질환, 증상과 관계없이 모두 포함하였다.
챗봇은 단순한 정보 전달 도구가 아니라 중재 효과를 유의미하게 발생시키는 주요 중재 수단으로 활용되어야 하며, 그 효과가 실험설계를 통해 평가된 경우에 한해 포함하였다. 중재의 기간, 횟수, 다른 중재와의 병행 여부는 포함 및 배제기준에 영향을 미치지 않았다. 반면, 챗봇의 개발, 타당성 또는 수용성만을 평가하고 중재 효과를 분석하지 않은 연구, 챗봇이 정보 전달에만 사용된 연구, 우울 또는 자살예방과 직접적으로 관련 없는 건강 문제를 다룬 연구는 제외하였다. 또한 챗봇이 아닌 가상 에이전트(virtual agent)만을 활용한 연구, 체계적 문헌고찰, 메타분석, 서론, 편집자 서한 등과 같이 원자료 분석이 불가능한 논문, 학술대회 초록, 포스터, 프로토콜 등 정식 출판되지 않은 문헌도 제외하였다. 실험연구가 아니거나 대조군을 포함하지 않은 연구 역시 포함하지 않았다.
문헌 선정 과정은 두 명의 연구자가 독립적으로 수행하였으며, 의견 불일치가 발생한 경우에는 논의와 합의를 통해 최종 포함 여부를 결정하였다.
5) 문헌 선택 과정
문헌검색은 2명의 연구자가 독립적으로 자료추출을 시행하였다. 문헌 선정기준과 배제기준에 따라 논문 제목과 초록을 검토하며 문헌을 추출하였고 2명의 연구자가 논의를 통한 합의된 결과를 적용하였다. 5개 데이터베이스에서 검색한 결과, 모두 263건의 논문이 검색되었다. 1차 문헌 제목과 초록을 검토하여 선정 기준에 적합하지 않은 220편의 문헌을 제거하였다. 다음으로 연구설계 기준에 맞지 않은 문헌 19편, 대상자 기준에 맞지 않은 문헌 5개, 결과 변수 기준에 맞지 않은 문헌 10개로 총 34개 문헌을 제외하였다. 최종으로 총 9편의 연구가 체계적인 문헌고찰을 위해 선정되었다(Fig 1).

Fig 1. PRISMA flow chart of study selection
Ⅲ. 결과
1. 문헌의 일반적 특성
본 연구의 최종 분석에 선정된 9편의 문헌에 대한 일반적 특성은 다음과 같다. 발표년도는 2025년 2편(Sharp 등, 2025; Tong 등, 2025), 2024년 6편(Ulrich 등, 2024a; Kleinau 등, 2024; Vereschagin 등, 2024; Ulrich 등, 2024b; Nianmongkon등, 2024; Karkosz 등, 2024), 2022년 1편(He 등, 2022)이 출판되었다. 표본 크기가 1명 이상 100명 이하인 문헌이 3편(Sharp 등, 2025; Nianmongkon 등, 2024; Karkosz 등, 2024), 101명 이상 200명 이하인 문헌이 3편(Ulrich 등, 2024a; Ulrich 등, 2024b; He 등, 2022), 200명 이상인 문헌이 3편(Tong 등, 2025; Kleinau 등, 2024; Vereschagin 등, 2024)이다.
2. 문헌의 질평가
총 9편의 문헌(Sharp 등, 2025; Tong 등, 2025; Ulrich 등, 2024a; Kleinau 등, 2024; Vereschagin 등, 2024; Ulrich 등, 2024b; He 등, 2022; Nianmongkon 등, 2024; Karkosz 등, 2024)을 대상으로 Cochrane의 Risk of Bias 2.0 도구에 따라 무작위 배정, 중재 이탈, 결과 자료의 결측, 결과 측정, 선택적 보고의 5가지 영역에서 비뚤림 위험을 평가하였다. 평가 결과, 모든 문헌에서 일부 또는 다수의 영역에서 비뚤림 위험이 존재하여, 낮은 위험으로 평가된 문헌은 없었다.
첫째, 무작위 배정 과정(Bias arising from the randomization process)에서는 대부분 문헌이 낮은 위험으로 평가되었으나, Ulrich 등(2024a)은 무작위 배정을 시행하지 않아 높은 위험으로, Nianmongkon 등(2024)은 무작위 배정 방식은 명확하나 할당 순서 은폐 방법이 불명확하여 정보 부족(no information)으로 평가되었다. 둘째, 의도한 중재에서의 이탈(Bias due to deviations from intended interventions) 영역에서는 Sharp 등(2025), Ulrich 등(2024a), Karkosz 등(2024)이 맹검 미실시로 인해 높은 위험으로 평가되었으며, Nianmongkon 등(2024)은 할당 결과의 은폐 조치 시행 여부가 불명확하여 정보 부족으로 분류되었다. 셋째, 결과 자료의 결측(Bias due to missing outcome data) 영역에서는 Tong 등(2025), Kleinau 등(2024), Ulrich 등(2024b), Nianmongkon 등(2024), Karkosz 등(2024)에서 위험이 지적되었다. Tong 등(2025)은 챗봇군에서 유의미하게 높은 탈락률이 확인되었으나, 탈락 사유에 대한 정보가 제공되지 않았다. Kleinau 등(2024)은 중재군 간 결측값 수의 불균형과 결측 사유에 따라 결과 왜곡 가능성이 제기되었으며, Ulrich 등(2024b), Nianmongkon 등(2024), Karkosz 등(2024) 또한 결측률과 처리 방식에 대한 정보 부족으로 인해 일부 우려 또는 정보 부족으로 평가되었다.
넷째, 결과 측정의 비뚤림(Bias in measurement of the outcome) 영역에서는 Ulrich 등(2024a), Kleinau 등(2024), Vereschagin 등(2024), Ulrich 등(2024b), Nianmongkon 등(2024), Karkosz 등(2024)에서 위험이 평가되었다. 이 중 Ulrich 등(2024a), Kleinau 등(2024), Karkosz 등(2024)은 연구 참여자와 연구자가 모두 배정군을 인지하고 있었고, 자가보고식 평가 도구를 사용하여 높은 비뚤림 위험으로 평가되었다. Vereschagin 등(2024), Ulrich 등(2024b), Nianmongkon 등(2024)은 맹검 수행 여부에 대한 명확한 정보가 없고, 스마트폰 앱을 통한 중재 특성상 배정 인지가 가능했을 것으로 판단되어 일부 우려로 평가되었다. 다섯째, 선택적 보고의 비뚤림(Bias in selection of the reported result) 영역에서는 9편 모두 사전 분석 계획의 명시 여부나 분석 시행 시점(중재 결과 자료 눈가림 해제 전 시행 여부)에 대한 정보가 명확하지 않아, 보수적으로 일부 우려 위험(some concerns)으로 평가하였다. 요약하면, 9편 모두에서 일부 또는 다수의 영역에서 비뚤림 위험이 확인되었으며, 낮은 비뚤림 위험으로 평가된 문헌은 존재하지 않았다. 특히, 맹검 미실시와 결측 자료 처리에 대한 정보 부족이 주요한 비뚤림 원인으로 작용하였다(Fig 2).

Fig 2. Risk of bias graph and summary
3. 대상자 특성
대상자 총 표본크기는 최소 36명(Nianmongkon 등, 2024)에서 최대 1,489명(Vereschagin 등, 2024)에 이르며, 전체 연구를 통틀어 중재군과 대조군을 합한 총 참여자는 2,948명이었다. 참여자의 특성은 우울·불안 증상자(He 등, 2022; Nianmongkon 등, 2024; Karkosz 등; 2024), 스트레스 경험 대학생(Ulrich 등, 2024a), 섭식장애 치료 대기자(Sharp 등, 2025), 일반 성인(18세 이상)(Tong 등, 2025; Ulrich 등, 2024b), 물질사용 고위험 대학생(Vereschagin 등, 2024), 보건종사자(Kleinau 등, 2024), 두통 환자(Ulrich 등, 2024b) 등으로 다양했으며, 연령은 18–30세 청년층(He 등, 2022), 18세 이상 전 연령)(Tong 등, 2025; Ulrich 등, 2024b), 특정 질환군(섭식장애·스트레스·두통·MDD) 기준으로 60대 고령자까지 폭넓게 포함되었다. 일부 연구에서는 성별, 교육 수준 등 추가적인 인구 사회학적 변인을 함께 보고하여 중재 효과의 일반화 가능성을 높이고자 하였다.
4. 중재 특성
모든 연구는 무작위대조군시험(randomized controlled trial) 설계였고, 이 중 Ulrich 등(2024a)과 Nianmongkon 등(2024)은 파일럿 RCT로 예비 연구 성격을 띠었다. 효과 e측정에는 우울(PHQ-9, CESD-R), 불안(GAD-7, STAI), 스트레스(PSS-10, DASS-21), 삶의 질·웰빙(WHO-5, SWEMWBS, SWLS), 자기효능감(SUPPH, HMSE-G-SF), 자기관리 행동(SCBI, eTAP), 복약 순응도(MARS, Pill Count), 사용성(SUS, UMUX-LITE) 등 30여종의 표준화 척도가 활용되었다. 중재 프로그램은 크게 ‘챗봇 기반 대화형’과 ‘앱 기반 모듈형’으로 구분되며, 챗봇의 작동방식은 분석된 9편의 문헌 중 4편에서 규칙 기반 응답 구조를 따르는 rule-based 방식을 사용하였으며(Sharp 등, 2025; Tong 등, 2025; Ulrich 등, 2024a; Karkosz 등; 2024), 이 중 1편에서는 특정 주제에 특화된 콘텐츠를 중심으로 구성된 topic-specific 방식과 rule-based 방식을 함께 사용(Tong 등, 2025). Tree-based 챗봇으로 rule-based 챗봇의 한 유형으로, 미리 설계된 의사결정트리(decision tree) 구조에 따라 대화가 진행되는 방식(Karkosz 등; 2024)을 사용하였다. 모바일앱과 자동화된 챗봇을 결합한 방식은 2편(Vereschagin 등, 2024; Ulrich 등, 2024b), 작동방식을 언급하지 않은 것은 3편(Kleinau 등, 2024; He 등, 2022; Nianmongkon 등, 2024)이었다. 이처럼 대부분의 챗봇은 규칙 기반 대화 구조를 중심으로 구성되었다.
챗봇은 최종 선정된 9편의 문헌 중 7편에서는 인지행동치료(cognitive behavioral therapy; CBT)를 기반으로 한 챗봇 개입이 이루어졌다(Sharp 등, 2025; Tong 등, 2025; Ulrich 등, 2024a; Kleinau 등, 2024; Vereschagin 등, 2024; Ulrich 등, 2024b; He 등, 2022). 이러한 CBT 기반 챗봇은 주로 자가교육(psychoeducation), 인지 재구성(cognitive restructuring), 스트레스 관리, 감정 조절(emotion regulation), 행동 활성화(behavioral activation), 명상(mindfulness), 자기 모니터링(self-monitoring) 등의 기능을 포함하였다.
이러한 챗봇 중재는 단순한 정보 전달을 넘어, 사용자 참여를 유도하는 다양한 행동 변화 기법을 포함하고 있었다. 대부분의 중재에서는 심리교육(psychoeducation)과 함께 인지 재구성(cognitive restructuring), 감정 조절(emotion regulation), 명상(mindfulness) 훈련이 통합되었으며(Sharp 등, 2025; Tong 등, 2025; Ulrich 등, 2024a; Kleinau 등, 2024; Vereschagin 등, 2024; Ulrich 등, 2024b; He 등, 2022), 긍정심리 개입(positive psychology) 요소로서 감사 훈련(gratitude practice)이나 회복탄력성 강화 활동이 추가된 경우도 확인되었다(Tong 등, 2025; Kleinau 등, 2024; Karkosz 등; 2024). 중재 구성은 일반적으로 행동 활성화(behavioral activation)를 중심으로 하되, 근육 이완이나 호흡 훈련과 같은 신체 기반 개입(practical relaxation exercises)이 병행되었으며(Tong 등, 2025; Kleinau 등, 2024; Ulrich 등, 2024b), 스트레스 요인을 다루는 인지-정서 훈련이 포함된 사례도 있었다(Ulrich 등, 2024a; He 등, 2022).
중재 콘텐츠는 텍스트 기반 대화 외에도 짧은 동영상, 이미지, 인터랙티브 활동으로 구성되어 있었고, 일부 챗봇은 텍스트-음성-이미지를 결합한 다중모드 상호작용(multimodal interaction)을 제공하였다(He 등, 2022). 특히, 사용자의 기분 상태에 따른 자동화된 반응, 일일 메시지 제공(daily coaching prompts), 자가 평가 결과에 따른 피드백 기능(personalized feedback)이 포함되어 사용자 맞춤형 경험을 제공하는 경향이 나타났다(Tong 등, 2025; Kleinau 등, 2024; He 등, 2022).
한편, 몇몇 챗봇은 자가관리 기술 향상(self-management skills)과 행동 계획(action planning), 의도 설정(intention setting), 목표 반영(task feedback) 등의 구성 요소를 포함함으로써 사용자의 주체적인 변화 과정을 유도하였다(Tong 등, 2025; Ulrich 등, 2024b). 예를 들어, 만성 두통 대상자를 위한 챗봇은 에너지 균형, 대처 전략, 휴식 기법 등을 포함한 행동 훈련 기능을 탑재하고 있었으며(Ulrich 등, 2024b), 우울증 치료에 특화된 챗봇은 약물 복용 알림과 실시간 채팅 기능을 제공하여 치료 순응도를 높이고자 하였다(Nianmongkon 등, 2024).
Table 1. Characteristic of selected studies (N= 9)

또한, 위기 상황 대응 기능(crisis detection and response)을 내장한 챗봇도 일부 확인되었다. Fido 챗봇은 자살 사고 또는 위험 발언이 탐지되었을 때 자동으로 응급 연락망 정보를 제공하였으며(Karkosz 등; 2024), Vitalk 챗봇 또한 PHQ-9 등의 정신건강 평가 도구를 기반으로 자살 위험이 감지될 경우 사용자의 위치에 따른 지원 정보를 연계 제공하는 구조로 설계되어 있었다(Kleinau 등, 2024). 앱 기반 모듈형 중재는 라이프스타일 코칭 모듈 7개를 통합한 BalanceUP App(Ulrich 등, 2024b)과 12주간 복약 알림·교육·실시간 상담 기능을 갖춘 BesideYou 앱(Nianmongkon 등, 2024)으로 구성되었으며, 모듈별 행동계획 수립, 자가관리 및 약물 순응도 관리 기능을 포함하였다.
5. 결과 측정 및 효과
챗봇 중재의 효과는 다양한 정신건강 지표를 통해 평가되었으며, 대부분의 연구에서 통계적으로 유의미한 개선 효과가 확인되었다. 우울(depression)은 주로 Patient Health Questionnaire-9(PHQ-9) 도구를 통해 측정되었으며, 8편 중 7편에서 중재군의 점수가 유의하게 감소하였다(Sharp 등, 2025; Tong 등, 2025; Ulrich 등, 2024a; Kleinau 등, 2024; Vereschagin 등, 2024; Ulrich 등, 2024b; He 등, 2022; Nianmongkon 등, 2024; Karkosz 등; 2024). 불안(anxiety)은 DASS-21, GAD-7, STAI 등을 통해 평가되었으며, 4편에서 유의미한 감소가 보고되었다(Sharp 등, 2025; Kleinau 등, 2024; Vereschagin 등, 2024; Karkosz 등; 2024). 특히 Vitalk 챗봇은 불안 외에도 번아웃(burnout), 회복탄력성, 회복활동수행(behavioral activation)에서 효과를 보였다(Kleinau 등, 2024). 스트레스(stress)는 PSS-10 등을 활용하여 측정되었고, 2편에서 유의한 감소를 보고하였다. 신체화 증상(somatic symptoms) 또한 PHQ-15를 통해 평가되었으며, 두 편의 연구에서 유의한 개선이 확인되었다(Ulrich 등, 2024a; Ulrich 등, 2024b). 행동 변화 관련 변수로는 자기관리 자기효능감(self-care self-efficacy), 자기관리 행동(self-care behavior), 변화 의도(intent to change behavior) 등이 있었으며, Boond과 BalanceUP 챗봇을 활용한 연구에서(Tong 등, 2025; Ulrich 등, 2024b)에서 모두 유의한 향상이 나타났다. 회복탄력성(resilience)은 RS-14 등을 통해 측정되었고, Vitalk 챗봇 중재군에서 통계적으로 유의한 증가가 확인되었다(Kleinau 등, 2024). 정신적 안녕감(mental well-being)은 PERMA Scale 또는 Warwick-Edinburgh Mental Wellbeing Scale 등을 사용하여 평가되었으며, 3편에서(Tong 등, 2025; Vereschagin 등, 2024; Ulrich 등, 2024b) 전반적 안녕감 및 긍정정서가 향상되었다. 기타 보조 효과로는, 약물 복용 순응도(MARS, PC)에서 유의미한 향상을 보였으며(Nianmongkon 등, 2024), Fido 챗봇의 고빈도 사용자에서는 외로움 감소도 보고되었다(Karkosz 등; 2024).
Ⅳ. 고찰
본 연구는 챗봇 기반 정신건강 중재의 효과를 체계적으로 고찰하고, 대상군의 특성과 중재 전략 간의 연관성을 분석하였다. 대상군은 정신건강 고위험군, 정신건강 취약군, 보건의료 종사자, 대학생 및 일반 성인군으로 분류되며, 각 집단의 생활 맥락과 정신건강 위험 수준에 따라 중재 기제가 달리 작동함을 확인하였다. 전반적으로 챗봇 중재는 예방과 개입 양측면에서 일정 수준의 효과를 보였다.
정신건강 고위험군에는 섭식장애 대기자(Sharp 등, 2025), 주요우울장애 진단자(Nianmongkon 등, 2024), 우울증상이 있는 청년층(He 등, 2022) 등이 포함되며, 이들에게는 인지행동치료(CBT) 기반의 정서 조절 기능을 중심으로 구성되었다. 섭식장애 대기자와 우울증상을 지닌 청년층에게 적용된 챗봇은 증상 평가와 심리교육, 자기 노출 및 감정 추적 기능을 통해 정서적 고통을 완화하는 데 기여하였다(Sharp 등, 2025; He 등, 2022). 이는 챗봇이 비대면 환경에서도 인지재구성 및 감정 조절을 유도할 수 있는 가능성을 보여준다.
정신건강 취약군은 반복적 스트레스 노출이나 만성 증상을 경험하는 집단으로, 이들에게는 스트레스 관리와 이완 기법 중심의 중재가 제공되었다. 예를 들어, MISHA와 BalanceUP 챗봇은 각각 신체화 증상과 스트레스 완화, 자기효능감 증진에 긍정적인 영향을 미쳤으며(Ulrich 등, 2024a, 2024b), 이는 챗봇이 자기조절 기술을 보완할 수 있는 도구로 기능함을 시사한다.
보건의료 종사자 대상 중재에서는 긍정심리학 기반 요소와 CBT, 명상 및 피드백 기능이 통합된 챗봇이 번아웃과 불안을 감소시키고 회복탄력성을 높이는 데 효과적이었다(Kleinau 등, 2024). 이는 높은 업무 강도를 경험하는 직군에서도 챗봇이 정서 회복을 지원할 수 있음을 보여준다.
대학생 및 일반성인군을 대상으로 한 중재에서는 행동변화와 자기관리 촉진이 중심 기제로 작동하였다. Minder와 Fido 챗봇은 정서적 웰빙 향상, 우울 및 외로움 감소에 기여하였으며(Vereschagin 등, 2024; Karkosz 등, 2024), 다양한 치료적 접근이 통합된 챗봇일수록 더 복합적인 심리적 효과를 나타냈다.
이러한 결과를 종합하면, 챗봇 중재는 단순한 정보 제공을 넘어, 인지·정서 조절, 동기 촉진, 자기효능감 강화 등 다양한 심리기제를 통해 대상자의 정신건강을 다면적으로 지원할 수 있음을 보여준다. 특히, 중재 내용이 대상자의 생활 맥락에 맞게 설계되었을 때 효과성이 높아지는 경향이 확인되었다.
본 연구는 챗봇 기반 정신건강 중재의 효과를 체계적으로 고찰하였으며, 특히 우울과 자살 예방이라는 핵심 변수에 주목하였다. 분석된 9편의 최신 RCT 연구는 다양한 정신건강 변수에 대한 챗봇의 긍정적 효과를 보고하고 있었으나, 자살예방을 직접 목표로 한 중재는 여전히 확인되지 않았다.
우울(depression)은 거의 모든 연구에서 중재 효과가 평가된 핵심 변수로, 섭식장애 대상자(Sharp 등, 2025), 대학생(Vereschagin 등, 2024) 두통 경험자(Ulrich 등, 2024b), 주요우울장애 진단자(Nianmongkon 등, 2024), 우울증상이 있는 청년층(He 등, 2022) 등을 대상으로 유의미한 감소 효과가 보고되었다. 이는 챗봇이 감정 추적, 자기노출 촉진, 인지재구성, 동기 부여 등의 기능을 통해 우울 완화에 효과적이라는 점을 시사한다. 또한 불안(anxiety) 및 스트레스(stress) 관련 변수 또한 다양한 집단에서 개선 효과가 나타났다(Ulrich et al., 2024a; Ulrich et al., 2024b; Kleinau et al., 2024). 이는 스트레스 인지와 감정 조절을 위한 전략들이 챗봇의 핵심 중재 요소로 체계적으로 포함되어 있기 때문으로 해석된다(Ulrich 등, 2024a, 2024b; Kleinau 등, 2024).
행동변화 관련 변수로는 자기효능감(self-efficacy)(Tong 등, 2025; Ulrich 등, 2024b), 자기관리 행동(self-care behaviors)(Tong 등, 2025), 변화 의도(intention to change)(Tong 등, 2025; Ulrich 등, 2024b), 약물 복용 순응도(Nianmongkon 등, 2024) 등에서 긍정적인 변화가 확인되었다. 이는 챗봇이 정보 제공을 넘어 사용자의 행동 실천을 유도하고, 습관화 과정을 지원할 수 있음을 시사한다. 또한 챗봇 중재는 정서적 웰빙과 긍정 정서 강화, 회복탄력성 증진, 마음챙김 향상 등의 긍정심리 영역에서도 효과를 나타냈다(Tong 등, 2025; Kleinau 등, 2024). 이는 챗봇이 단기적인 증상 완화를 넘어 전반적인 삶의 질을 증진하는 잠재력을 지니고 있음을 보여준다.
마지막으로, 챗봇 기반 중재는 신체-심리 연관 변수에 까지 영향을 미쳤다. 신체화 증상(somatic symptoms)이나 두통, 통증 인식, 결근 및 생산성 저하(absenteeism and presenteeism) 등에 대해 통계적으로 유의한 개선이 관찰되었으며(Ulrich 등, 2024a; Ulrich 등, 2024b), 이는 챗봇이 정신적 개입을 통해 신체적 건강에도 간접적으로 긍정적 영향을 줄 수 있다는 점에서 주목할 만하다.
최근 챗봇 및 생성형 인공지능(Generative AI)을 활용한 정신건강 중재 연구가 활발히 진행되고 있으나, 자살 예방을 목표로 하는 직접적인 챗봇 기반 RCT 연구는 현재까지 확인되지 않았다. 그러나 관련 연구들을 통해 챗봇 기반 중재의 가능성과 한계를 간접적으로 살펴볼 수 있다.
우선, 자살 사고에 대한 적절한 반응을 구별하는 large language models (LLMs)의 역량을 평가한 연구에서는, 일부 모델이 정신건강 전문가 수준의 성능을 보였으나(McBain 등, 2025), 상향편향(upward bias) 문제와 함께 고위험 상황에서 위기 신호를 간과할 가능성도 제기되었다. 이러한 결과는 챗봇이 자살위험 대응에 있어 충분한 임상적 안전성과 신뢰성을 확보하지 못하고 있음을 시사한다.
또한, 실제 자살예방에 텍스트 기반 중재가 사용된 연구에서도 문자 메시지(Text4Strength)를 활용한 개입은 자살 행동 감소를 목표로 하였지만, 그 효과는 제한적이었다(Pisani 등, 2024). 이는 단순한 문자 기반 접근보다는 사용자의 감정 흐름에 따라 반응을 조정하고, 상호작용을 주도할 수 있는 챗봇 기반의 정교한 중재가 필요함을 시사한다.
자살 사고 탐지를 위한 Bidirectional Encoder Representations from Transformers(BERT) 모델 및 LLM 비교 연구에서는, LLM 중 일부(ChatGPT-3.5 등)는 상당한 정확도를 보였으나, Google에서 개발한 LLM을 기반으로 한 챗봇인 Bard와 같은 모델은 낮은 탐지력을 보여 모델 간 편차가 크다는 점이 한계로 지적되었다(Oliveira 등, 2024). 또한 이들 모델은 아직 임상 환경에서 검증되지 않았으며, 오남용 시 치료적 해를 유발할 수 있기에 신중한 접근이 요구된다(Woodnutt 등, 2024; Heston, 2023).
이와 같은 배경에서 챗봇 중재의 임상적 활용 가능성은 제한적이지만, 가능성은 존재한다. 예컨대 응급실 기반의 자살 위험 중재 프로그램에서 챗봇 기반 태블릿 자가 관리가 대면 진료와 유사한 수용성과 안전 계획의 질을 보였다는 연구 결과는(Larkin 등, 2023a) 챗봇이 적절한 디자인과 프로토콜 하에 실제 진료 환경에서도 적용 가능함을 보여준다. 나아가 자살 위험이 있는 환자를 위해 응급실에서 시행된 기존 중재(응급실 안전 평가 및 후속 조치 평가(emergency department safety assessment and follow-up evaluation(ED-SAFE)) 기반 앱 설계에서도 챗봇 인터페이스를 활용한 웹 앱(web app)이 높은 사용성과 참여도를 보인 점은(Larkin 등, 2023b) 챗봇이 의료 시스템 내 안전계획 수립 도구로도 활용 가능함을 시사한다.
사용자 수용성과 실제 효과 측면에서도 긍정적인 신호가 나타났다. CBT 기반 챗봇을 청소년에게 제공한 연구에서 높은 수용성과 우울 증상의 유의미한 감소가 확인되었고(Nicol 등, 2022), Replika 사용자의 일부(3 %)는 챗봇이 자살 충동을 멈추게 했다고 보고하였다(Maples 등, 2024). 또한 챗봇은 판단하지 않고 공감적으로 반응하며 자살위험 관리, 기분 모니터링, 활동 안내 등의 기능을 제공할 수 있음이 콘텐츠 분석을 통해 드러났다(Martinengo 등, 2022).
그러나 챗봇의 한계도 뚜렷하다. ChatGPT 기반 챗봇의 위기 대응 평가 연구에서는 대부분 중등도 우울 수준(PHQ-9= 12)에서야 인간 개입을 권유하고, 심각한 수준(PHQ-9= 25)에서야 대화를 중단하는 등, 위기 개입 시점이 지연되고, 핫라인 안내도 부족하다는 점이 밝혀졌다(Heston, 2023). 이는 챗봇이 위기 상황을 실시간으로 인지하고 안전하게 대처하기에는 아직 미흡함을 시사한다. 더불어 챗봇 기반 개입은 심리적 관계 형성이나 사회적 참여, 의미 있는 회복 과정 등 정신건강 돌봄의 핵심 요소를 대체하기 어렵다는 비판도 존재한다(Woodnutt 등, 2024). 특히 윤리적 위험성과 치료적 신뢰의 부재는 임상 적용에 있어 가장 큰 장애 요인으로 지적된다.
그럼에도 불구하고 챗봇 기반 중재의 확장 가능성과 실용성은 계속 연구되고 있다. 예컨대 입원환자를 대상으로 간호사의 자살 안전계획 교육에 챗봇 및 AI 피드백 시스템을 활용한 연구(Darnell 등, 2021)나, 스마트폰 기반 자살 생각 모니터링 챗봇인 SIMON(Sels 등, 2021)의 개발은 챗봇을 활용한 교육 및 위험 감시 시스템의 잠재력을 보여준다. 또한 앱 내 자살예방 가이드라인 준수 여부를 평가한 연구에서는 자살 예방을 위한 조언 제공이 다소 부족했으나, 기반 프레임이 마련되고 있다는 점은 긍정적이다(Sels 등, 2021). 최근에는 체현형 대화 에이전트를 활용한 자살행동 감지 앱의 수용성을 탐색한 연구도 등장하고 있으며(Martinez-Miranda 등, 2019), 이는 향후 챗봇 기술이 더 직관적이고 인간적인 형태로 진화할 수 있음을 시사한다.
본 연구는 챗봇 중재가 우울 및 자살 예방에 미치는 효과를 탐색하고자 하였으나, 다음과 같은 몇 가지 한계를 지닌다.
첫째, 챗봇 중재의 자살 예방 효과를 검증한 무작위 대조시험(RCT)이 매우 부족하다는 점이다. 본 문헌고찰 과정에서 확인된 대부분의 연구는 파일럿 연구, 사용자 수용성 조사, 콘텐츠 분석 및 시뮬레이션 기반 평가에 국한되어 있었으며, 실제 임상 환경에서 챗봇의 중재 효과를 명확하게 검증한 대규모 RCT는 존재하지 않았다. 예를 들어, 우울증을 겪는 청소년을 대상으로 한 CBT 기반 챗봇 중재의 수용성과 타당성을 확인한 소규모 예비 RCT는 있었지만(Martinengo 등, 2022) 자살예방 효과를 명확히 검증한 본격적인 RCT는 없었다. 이는 챗봇 중재가 자살 사고나 자살 행동에 어떤 인과적 영향을 미치는지를 확인하는 데 제한점이 있음을 의미한다.
둘째, 챗봇의 임상적 안전성과 윤리성에 대한 검증도 미흡하다. 일부 연구에서는 챗봇이 자살 위험군의 상황을 적절히 인식하지 못하거나, 위기 상황에서 인간 상담으로의 연계를 늦추는 등의 문제점이 보고되었다(McBain 등, 2025; Maples 등, 2024; Heston, 2023). 이는 챗봇의 잠재적 해악 가능성을 내포하고 있으며, 무분별한 임상 적용에 대한 우려를 제기한다.
셋째, 본 연구에 포함된 문헌들은 대체로 질적 탐색이나 기술적 프로토타입 개발에 초점을 두고 있어, 챗봇 중재가 실제로 임상 현장에서 지속가능한 중재로서 기능할 수 있는지에 대한 실증적 근거가 부족하다. 특히 다양한 연령대, 문화적 배경, 정신질환 중증도에 따른 효과 차이를 분석한 연구가 미비하며, 중재 효과의 일반화 가능성에 한계가 있다.
마지막으로, 현재 챗봇 중재는 자살위험군에 대한 장기 추적 연구(longitudinal study)가 부족하며, 일회성 사용 후 평가에 머무르는 경향이 많다. 자살 예방은 단기 개입만으로는 충분하지 않기 때문에, 장기적인 관점에서 챗봇이 지속적으로 개입하고 위험을 모니터링할 수 있는 역량을 갖추었는지를 검토할 필요가 있다.
이러한 점들을 고려할 때, 향후 연구에서는 임상 시험 설계에 기반한 고품질 RCT의 수행, 장기 추적 관찰, 윤리적 안전장치의 마련, 다양한 인구 집단에 대한 맞춤형 중재 평가 등이 이루어져야 할 것이다.
Ⅴ. 결론
본 연구는 챗봇 기반 정신건강 중재의 효과성을 체계적으로 고찰하고, 특히 우울과 자살 예방을 중심으로 챗봇의 적용 가능성과 한계를 분석하였다. 분석 결과, 챗봇 중재는 우울, 불안, 스트레스, 자기효능감, 정서적 웰빙 등 다양한 정신건강 지표에서 긍정적인 효과를 보였으며, 대상군의 특성과 필요에 따라 중재 기능이 다르게 작동함을 확인하였다. 그러나 자살예방을 직접 목표로 한 고품질 RCT는 부재하며, 임상적 안전성, 위기대응 적절성, 윤리적 검증이 여전히 미흡하였다. 향후 연구에서는 자살위험군을 포함한 다양한 인구 집단을 대상으로 한 장기 추적 연구와 함께, 챗봇의 임상적 유효성과 안전성을 검증하는 정교한 중재 설계가 필요하다. 이를 통해 챗봇이 정신건강 돌봄의 보완적 수단으로서 보다 신뢰받는 디지털 중재로 자리매김할 수 있을 것이다.
References
- Boucher EM, Harake NR, Ward HE, et al(2021). Artificially intelligent chatbots in digital mental health interventions: a review. Expert Rev Med Devices, 18(S1), 37-49. DOI: 10.1080/17434440.2021.2013200
- Choi SH, Kang SR(2021). A qualitative study on the job of mental health social workers. The Journal of Humanities and Social science (HSS21), 12(1), 2279-2294.
- Darnell D, Arean PA, Dorsey S, et al(2021). Harnessing innovative technologies to train nurses in suicide safety planning with hospitalized patients: protocol for formative and pilot feasibility research. JMIR Res Protoc, 10(12), Printed Online. DOI: 10.2196/33695
- Fitzpatrick KK, Darcy A, Vierhile M(2017). Delivering cognitive behavior therapy to young adults with symptoms of depression and anxiety using a fully automated conversational agent (Woebot): a randomized controlled trial. JMIR Ment Health, 4(2), Printed Online. DOI: 10.2196/mental.7785
- Fortunati L, Edwards A(2020). Opening space for theoretical, methodological, and empirical issues in human-machine communication. Hum-Mach Commun, 1, 7-18. https://doi.org/10.30658/hmc.1.1
- Fulmer R, Joerin A, Gentile B, et al(2018). Using psychological artificial intelligence (Tess) to relieve symptoms of depression and anxiety: randomized controlled trial. JMIR Ment Health, 5(4), Printed Online. DOI: 10.2196/mental.9782
- Haque MDR, Rubya S(2023). An overview of chatbot-based mobile mental health apps: insights from app description and user reviews. JMIR Mhealth Uhealth, 11(1), Printed Online. DOI: 10.2196/44838
- He Y, Yang L, Zhu X, et al(2022). Mental health chatbot for young adults with depressive symptoms during the COVID-19 pandemic: single-blind, three-arm randomized controlled trial. J Med Internet Res, 24(11), Printed Online. DOI: 10.2196/40719
- Heston TF(2023). Safety of large language models in addressing depression. Cureus, 15(12), Printed Online. DOI: 10.7759/cureus.50729
- Im HJ, Kang MH, Oh KO(2013). Nursing activities, job stress, and job satisfaction of nurses in mental health care facilities. Journal of Digital Convergence, 11(12), 507-513. DOI: 10.14400/JDPM.2013.11.12.507
- Inkster B, Sarda S, Subramanian V(2018). An empathy-driven, conversational artificial intelligence agent (Wysa) for digital mental well-being: real-world data evaluation mixed-methods study. JMIR Mhealth Uhealth, 6(11), Printed Online. DOI: 10.2196/12106
- Jang GY, Seo YS(2022). The counselors' perceptions of psychological counseling chatbots. Couns Res, 23(6), 17-48. DOI: 10.15703/kjc.23.6.202212.17
- Jang MY, Kim CG(2020). Impact of job stress on turnover intention among mental health facility staff: mediating effect of positive psychological capital. Journal of the Korea Contents Association, 20(12), 370-382. DOI: 10.5392/JKCA.2020.20.12.370
- Jiang J, Yang Y(2025). GymBuddy and Elomia, AI-integrated applications, effects on the mental health of students with psychological disorders. BMC Psychol, 13(1), 1-9, DOI: 10.1186/s40359-025-02640-0
- Karkosz S, Szymanski R, Sanna K, et al(2024). Effectiveness of a web-based and mobile therapy chatbot on anxiety and depressive symptoms in subclinical young adults: randomized controlled trial. JMIR Form Res, 8, Printed Online. DOI: 10.2196/47960
- Kim HS, Choi MH, Kim KM(2023). A study on the design and effectiveness of a AI-based hyper-personalized mental health counseling system. The Journal of Humanities and Social science (HSS21), 14(3), 3777-3790, DOI: 10.22143/HSS21.14.3.268
- Kim YS, Oh HY, Seo TW(2024). Implementation of suicide prevention digital therapeutics using digital humans and prediction model. Journal of the Korea Institute Of Information and Communication Engineering, 28(4), 467-477. https://doi.org/10.6109/jkiice.2024.28.4.467
- Kim SY, Park DA, Seo HJ, et al(2020). Health technology assessment methodology: systematic review. National Evidence-based Healthcare Collaborating Agency, 1-392.
- Kleinau E, Lamba T, Jaskiewicz W, et al(2024). Effectiveness of a chatbot in improving the mental wellbeing of health workers in Malawi during the COVID-19 pandemic: a randomized, controlled trial. PLoS One, 19(5), Printed Online. DOI: 10.1371/journal.pone.0303370
- Kwon CY(2024). Utilization of generative artificial intelligence chatbot for training in suicide risk assessment of depressed patients: focusing on students at a college of korean medicine. J Oriental Neuropsychiatry, 35(2), 153-162.
- Larkin C, Tulu B, Djamasbi S, et al(2023a). Comparing the acceptability and quality of intervention modalities for suicidality in the emergency department: randomized feasibility trial. JMIR Ment Health, 10(1), Printed Online. DOI: 10.2196/49783
- Larkin C, Djamasbi S, Boudreaux ED, et al(2023b). ReachCare mobile apps for patients experiencing suicidality in the emergency department: development and usability testing using mixed methods. JMIR Form Res, 7(1), Printed Online. DOI: 10.2196/41422
- Lee, HI, Song, HC, Lee, IG(2024). Analysis of technical limitation in psychological counseling service using AI chatbot technology. Korea Institute of Electronic Communication Science, 875–877. DOI: 10.3745/PKIPS.y2024m05a.875
- Lee JY, Lee SH, Kwon JH, et al(2022). Counseling use case analysis of AI-based chatbot and suggestion for developing a chatbot for school counseling. The Korean Journal of Elementary Counseling, 21(3), 243-267. DOI: 10.28972/kjec.2022.21.3.243
- Lee, SH, Lee, JY(2023). Development of artificial intelligence-based counseling chatbot for elementary school students and verification of effectiveness. Journal of the Korean Association of Information Education, 27(4), 425-432. DOI: 10.14352/jkaie.2023.27.4.425
- Maples B, Cerit M, Vishwanath A, et al(2024). Loneliness and suicide mitigation for students using GPT3-enabled chatbots. NPJ Ment Health Res, 3(1), 4. DOI: 10.1038/s44184-023-00047-6
- Martinengo L, Lum E, Car J(2022). Evaluation of chatbot-delivered interventions for self-management of depression: content analysis. J Affect Disord, 319, 598-607. DOI: 10.1016/j.jad.2022.09.028
- Martinengo L, Van Galen L, Lum E, et al(2019). Suicide prevention and depression apps' suicide risk assessment and management: a systematic assessment of adherence to clinical guidelines. BMC Med, 17(1), Printed Online. DOI: 10.1186/s12916-019-1461-z
- Martinez-Miranda J, Martinez A, Ramos R, et al(2019). Assessment of users' acceptability of a mobile-based embodied conversational agent for the prevention and detection of suicidal behaviour. J Med Syst, 43(8), 246. DOI: 10.1007/s10916-019-1387-1
- McBain RK, Cantor JH, Zhang LA, et al(2025). Competency of large language models in evaluating appropriate responses to suicidal ideation: comparative study. J Med Internet Res, 27, Printed Online. DOI: 10.2196/67891
- Nianmongkon K, Samphao T, Nuchchom P, et al(2024). Impact of a depression-specific pharmaceutical care counseling and smartphone app in medication adherence among patients with major depressive disorders: a pilot study. Pharmacy Pract, 22(3), Printed Online.
- Nicol G, Wang R, Graham S, et al(2022). Chatbot-delivered cognitive behavioral therapy in adolescents with depression and anxiety during the COVID-19 pandemic: feasibility and acceptability study. JMIR Form Res, 6(11), Printed Online. DOI: 10.2196/40242
- Oliveira AC, Bessa RF, Teles AS (2024). Comparative analysis of BERT‑based and generative large language models for detecting suicidal ideation: a performance evaluation study. Cad Saude Publica, 40(10), Printed Online. DOI: 10.1590/0102-311XEN028824
- On YS, Kim TS, Kim NW(2024). Psychotherapy based on the large language models: on the aspect of the theory of mind, a narrative review. J Korean Neuropsychiatr Assoc, 63(3), 151-166, DOI: 10.4306/jknpa.2024. 63.3.151
- Page MJ, McKenzie JE, Bossuyt PM, et al(2021). The PRISMA 2020 statement: an updated guideline for reporting systematic reviews. BMJ, 372. DOI: 10.1136/bmj.n71
- Park J, Lee SH(2022). An explorative study on the experiences and meanings of mental health helps-seeking among young people in Korea: implications for consumer-oriented mental health service design. Health and Social Welfare Review, 42(3), 65-94. DOI: 10.15709/HSWR.2022.42.3.65
- Pisani AR, Wyman PA, Cero I, et al(2024). Text messaging to extend school-based suicide prevention: pilot randomized controlled trial. JMIR Ment Health, 11, Printed Online. DOI: 10.2196/56407
- Richard AM, Huang R, Waidyanatha S, et al(2020). The Tox21 10K compound library: collaborative chemistry advancing toxicology. Chem Res Toxicol, 34(2), 189-216. DOI: 10.1021/acs.chemrestox.0c00264
- Sels L, Homan S, Ries A, et al(2021). SIMON: a digital protocol to monitor and predict suicidal ideation. Front Psychiatry, 12, Printed Online. DOI: 10.3389/fpsyt. 2021.554811
- Sharp G, Dwyer B, Randhawa A, et al(2025). The effectiveness of a chatbot single-session intervention for people on waitlists for eating disorder treatment: randomized controlled trial. J Med Internet Res, 27, Printed Online. DOI: 10.2196/70874
- Sung K, Lee DH, Hwang TY, et al(2024). A study on the factors affecting the duration between diagnosis of depressive disorder and suicide. Health and Social Welfare Review, 44(2), 239-255. DOI: 10.15709/HSWR.2024.44.2.239
- Tong ACY, Wong KTY, Chung WWT, et al(2025). Effectiveness of topic-based chatbots on mental health self-care and mental well-being: randomized controlled trial. J Med Internet Res, 27, Printed Online. DOI: 10.2196/70436
- Ulrich S, Lienhard N, Kunzli H, et al(2024a). A chatbot-delivered stress management coaching for students (MISHA App): pilot randomized controlled trial. JMIR Mhealth Uhealth, 12, Printed Online. DOI: 10.2196/54945
- Ulrich S, Gantenbein AR, Zuber V, et al(2024b). Development and evaluation of a smartphone-based chatbot coach to facilitate a balanced lifestyle in individuals with headaches (BalanceUP App): randomized controlled trial. J Med Internet Res, 26, Printed Online. DOI: 10.2196/50132
- Vereschagin M, Wang AY, Richardson CG, et al(2024). Effectiveness of the Minder mobile mental health and substance use intervention for university students: randomized controlled trial. J Med Internet Res, 26, Printed Online. DOI: 10.2196/54287
- Woodnutt S, Allen C, Snowden J, et al(2024). Could artificial intelligence write mental health nursing care plans?. J Psychiatr Ment Health Nurs, 31(1), 79-86. DOI: 10.1111/jpm.12965
- Yeh SF, Wu MH, Chen TY, et al(2022). How to guide task-oriented chatbot users, and when: a mixed-methods study of combinations of chatbot guidance types and timings. Proc CHI Conf Hum Factors Comput Syst, 1-18. DOI: 10.1145/3491102.3501941
- World Health Organization. Mental health and COVID‑19: early evidence of the pandemic's impact [Report]. Geneva: World Health Organization; 2022.
- Ministry of Health and Welfare. 2021 Suicide prevention white paper [Report]. Seoul: Ministry of Health and Welfare; 2021.
- Ministry of Health and Welfare National Center for Mental Health. National mental health status report 2020 [Report]. Seoul: Ministry of Health and Welfare National Center for Mental Health; 2020.
- National Center for Mental Health. Mental health survey 2021 [Report]. Seoul, Korea: National Center for Mental Health; 2021.
- Institute of Health Metrics and Evaluation. Global health data exchange (GHDx). Available at https://vizhub.healthdata.org/gbd-results/ Accessed May 14, 2022.
- World Health Organization (WHO). Depression, August 31, 2023. Available at http://www.who.int/news-room/ fact-sheets/detail/depression Accessed August 31, 2023.