\"baby-4100420_1280.jpg\"
출처:게티이미지뱅크

 

 

브라질 상파울루 대학교(USP) 연구팀이 머신러닝 기술을 활용해 저체중아 출산을 사전에 예측할 수 있는 모델을 개발했다. 저체중아, 즉 출생 체중이 2.5kg 미만인 신생아는 생후 사망 위험이 20배 높으며, 이후 삶에서 신경계 및 심혈관 질환, 당뇨병, 성장 장애 등 다양한 건강 문제에 노출될 가능성이 크다. 이에 따라 조기 예측과 개입의 중요성이 꾸준히 강조되어 왔으며, 이번 연구는 그 해결책으로 인공지능의 가능성을 제시했다.


연구는 브라질 상파울루 주 아라라콰라 지역의 인구 기반 코호트를 바탕으로 진행됐다. 총 1,579명의 임산부 데이터를 분석해 고급 머신러닝 알고리즘을 적용했으며, 북반구 국가 중심의 기존 연구들과 달리 라틴 아메리카 지역 인구 특성을 반영한 것이 특징이다. 연구팀은 랜덤 포레스트, XGBoost, LightGBM, CatBoost 네 가지 알고리즘을 실험했으며, 이 중 XGBoost가 저체중아 출산 위험군을 식별하는 데 가장 뛰어난 성능을 보였다.


이번 연구의 책임저자이자 USP 공중보건대학원(FSP-USP)의 파트리시아 론도 교수는 “머신러닝을 활용하면 고위험 임신을 조기에 인식하고 효과적으로 개입할 수 있어, 모자 건강을 개선하는 데 큰 영향을 미칠 수 있다”고 밝혔다. 특히 이 기술은 향후 임상 실무뿐 아니라 공공 보건 정책에도 실질적인 기여를 할 수 있을 것으로 기대된다.


저체중아 출산은 단순한 의학적 문제를 넘어 사회경제적 요인과도 깊이 연관된다. 산모의 나이, 교육 수준, 영양 상태, 산전 관리 접근성 등 다양한 요소가 복합적으로 작용하며, 머신러닝 모델은 이러한 요인들을 통합적으로 분석해 위험도를 평가할 수 있다. 데이터 과학자 아우덴시오 빅터는 “연구에서 활용한 변수들은 대부분 보건 현장에서 쉽게 수집 가능한 정보로, 비용 부담 없이 모델 적용이 가능하다”고 설명했다.


이번 모델은 아라라콰라 지역의 데이터를 기반으로 했지만, 연구진은 상파울루 주를 포함한 브라질 남동부 지역 전체에도 적용 가능하다는 사실을 확인했다. 다만, 아마존 지역이나 아프리카 국가 등 전혀 다른 지리적·사회적 배경을 가진 집단에는 추가적인 보정이 필요하다는 한계도 제시했다. 이는 머신러닝 모델이 단순히 알고리즘만으로는 충분하지 않으며, 적용 대상의 특성과 환경을 반영한 설계가 필수적임을 시사한다.


이번 연구가 주목받는 또 다른 이유는 아라라콰라 인구 코호트의 특수성에 있다. 이 코호트는 2,000명의 임산부와 그 자녀들을 추적해 영양 상태, 체성분, 건강지표 등을 종합적으로 분석하고 있어, 브라질 내에서도 보기 드문 귀중한 기초자료로 평가된다. 이 자료는 향후 유전적, 환경적, 후성유전적 요소를 포함한 다양한 건강 연구에 기반이 될 예정이다.


연구팀은 궁극적으로 이 머신러닝 기반 예측 모델이 의료진이 더 많은 산전 상담과 교육, 영양 보충, 생활습관 조정 등을 조기에 시행하는 데 도움이 될 것으로 기대하고 있다. 저체중아 출산의 부담을 줄이는 것은 개인의 건강뿐 아니라 국가적 차원의 의료비 절감과 삶의 질 향상에도 기여할 수 있는 중요한 과제다.