다기관 연구 소개

분당서울대학교병원 김헌민

“뇌전증 임상 CDE(Common Data Element) 기반 분산 데이터베이스 구축 사업”은 2023년 제1차 보건의료기술연구개발사업 중 신경계 질환 극복 사업의 하나로 시작된 연구 사업입니다. 줄여서 뇌전증 임상 CDE 분산 DB 구축 사업이라고 부르고 있습니다. 가장 핵심이 되는 내용은 1) 진료를 통해 작성하는 혹은 수집되는 정보를 바로 연구에 사용할 수 있도록 하고 2) 입력되는 정보를 표준화하고 3) 기존 레지스트리와 같이 데이터를 외부로 보내 하나의 물리적인 저장소에 두지 않고 각 병원의 의료정보시스템 혹은 서버 내에 분산된 데이터베이스 형태로 둔다는 개념입니다.

그림1. 뇌전증 CDE 과제의 개념도

본 과제는 총 5년간 (2023~2027) 진행됩니다. 총괄팀, 소아임상팀, 성인임상팀, 구조개발팀, 연구/권고안팀 총 5개 팀으로 구성되어 있습니다. 21개 병원이 참여하고 의료 IT 전문 기업인 이지케어텍 연구소가 기술적 지원을 하는 형태를 가지고 있습니다. 5년간 총 38억원의 연구비를 사용해서 연구 개발을 진행합니다. 유관 학회 주관 형태의 연구로 당시 뇌전증 학회 연구 이사인 삼성 서울 병원 신경과 손영민 교수님이 총괄 책임 연구자를 맡고 있습니다.

그림2. 전체 과제의 연차별 내용

(1) 의사의 진료 기록 정보

기존의 연구 방식은 각 병원에서 생성된 의사 기록을 연구자가 분석하고 해석하여 필요한 정보를 최대한 표준화하여 추출하지만 표준화하여 추출하지 않을 경우 정보의 정확도와 신뢰도가 많이 떨어집니다. 특히 바쁜 진료 세팅에서 매우 제한적인 정보만을 입력할 경우 정보의 충실도가 매우 낮아집니다. 이를 해결하기 위해서 전향적 임상 시험에서는 CDE (common data element)를 정해서 사용합니다. 대표적인 예로 NINDS (National Institute of Neurological Disorders and Stroke)의 뇌전증 CDE가 있습니다. 다만 이 CDE는 뇌전증 연구를 위한 것으로 진료 현장에서 바로 사용하기에는 항목이 매우 많고 복잡합니다. 이를 개선해서 진료에 필수적인 내용만을 선택하고 정의한 것을 저희는 clinical CDE라고 정하고 연구의 첫 부분으로 진료 현장에서 쉽게 사용할 수 있는 뇌전증 임상 CDE를 구축하였습니다. 이 표준화된 서식을 이용해서 진료에 활용할 경우 별도의 정보 수집 과정을 거치지 않고 표준화된 정보를 자동으로 모을 수 있습니다.

그림3. Pediatric Epilepsy Learning Healthcare System 그룹에서 만든 진료용 CDE 항목

(2) 검사 결과 및 처방 정보

대부분 병원에서 사용하고 있는 병원 정보 시스템 (Hospital information system)의 경우 상세한 처방 내용은 모두 표준화된 정보로 저장되어 있습니다. 또한 검사 결과 중 수치로 나오는 정보도 언제든 추출할 수 있게 되어 있습니다. 연구에 필요한 처방, 검사 결과는 시스템 내에서의 구조를 알면 필요한 때 원하는 정보만은 추출할 수 있습니다. 다만, 뇌파 검사 결과나 MRI 판독 결과 같이 freetext로 되어 있는 경우 판독문 자체를 추출할 수는 있어도 연구에 사용하려면 2차 분석 및 가공이 필요합니다. 따라서 본 과제에서는 이런 판독문을 처리하여 자동으로 필요 정보를 추출하는 알고리즘을 동시에 개발합니다.

(3) 자료 추출 툴킷 개발

진료 서식을 이용해서 표준화된 정보를 입력하고 자연어 기반의 판독문에서 주요 정보를 추출하더라도 다양한 종류의 임상 데이터를 추출하는데는 복잡한 과정에 필요합니다. 의료정보시스템에서 자료를 추출할 때 CDW (clinical data warehouse)에서 손쉽게 필요 정보를 추출하지만 매우 구체적으로 필요한 정보만을 추출하기는 어렵습니다. 따라서 본 과제에서는 뇌전증 DB 구축을 위한 툴킷을 개발합니다. 다만 병원마다 정보시스템을 제공하는 회사가 다르기 때문에 표준화하고 구조를 통일한 CDM (common data model)에서 정보를 추출하는 툴킷을 개발하고 테스트합니다. 이를 통해 다기관 분산 DB를 구축할 수 있는 가능성을 보이고 현실적인 어려움에 대한 해결책을 제시합니다.

(4) 연구 및 권고안 개발

본 과제를 통해 생성된 분산 DB에 있는 정보는 다양한 논문 및 권고안 개발에 사용됩니다. 여러 현실적인 제약에 의해 후향적 연구나 심지어는 전향적 연구도 단점과 제약이 있습니다. 다수의 환자에서 수집된 real world data는 이런 단점을 보완할 수 있으며 data generation 단계부터 표준화된 정보는 전향적 data와 같은 질적 수준을 보장합니다. 이런 데이터를 이용해서 현장에서 필요한 임상 질문에 대한 답을 주는 연구를 하고 한국 뇌전증 환자들의 정보를 이용해서 실용적인 권고안을 만들어서 본 과제에서 만들어지는 DB의 유용성을 밝히는 것을 최종 목표로 하고 있습니다.

뇌전증 임상 CDE 기반 분산 DB 구축 사업은 기존의 레지스트리 연구나 코호트 연구와는 다른 혁신적인 방법론을 적용하는 도전적인 과제입니다. 각종 AI, 초거대 언어 모델을 포함한 데이터 사이언스의 발전을 활용하는 연구입니다. 실제 현장에서 진료하고 핵심 정보를 만들어내는 주체인 저희가 큰 역할을 하고 성패를 좌우하는 연구입니다. 이 사업이 성공하고 지속적으로 임상 CDE 기반 서식을 사용할 경우 소수의 데이터를 이용하여 통계적 분석을 하는 연구가 아닌 전수의 정보를 사용하여 real world evidence를 추출할 수 있습니다. 더 나아가 저희가 매일 하고 있는 환자 진료를 통해서 고품질 의료 데이터를 만들고 큰 어려움 없이 모아 나갈 수 있는 연구로 많은 관심과 협조 부탁드립니다.

MAIN TOP