사시는 소아에서 흔하게 관찰되는 안과적 질환으로 두 눈이 정렬되지 않고 시축이 어긋난 상태를 말한다. 두 눈의 시축 방향에 따라서 외사시, 내사시, 수직사시로 분류할 수 있다.1,2 사시의 종류 중 하나인 간헐외사시는 외사위가 간헐적으로 융합눈모음이 깨어질 때 외사시가 발현하는 질환으로, 각성이 저하되거나 피로할 때 간헐적인 현성 사시가 발현한다.3 조절내사시는 조절과 연관되어 나타나는 내사시이며, 굴절교정에 따라 사시각의 변동이 생기는 경우가 많다.4
이런 사시나 사위를 진단하는 방법으로는 가림검사, 가림안가림검사, 교대가림검사를 시행할 수 있고, 사시각을 측정하기 위해 프리즘교대가림검사, Krimsky 검사, Hirschberg 검사 등을 시행할 수 있다.5-7
교대가림검사는 두 눈으로 시표를 주시시키고, 두 눈을 교대로 가리면서 가렸던 눈 움직임을 관찰하는 검사 방법으로 임상에서 흔히 사용되는 객관적인 진단 방법이다.8 이와 함께 프리즘을 이용해서 눈의 움직임이 없어질 때까지 프리즘을 증감하여 사시각을 측정하는 프리즘교대가림검사가 있다.9
이러한 사시 검사는 검사자가 직접 검사를 시행하면서 한 눈의 변화를 파악하여 측정하는 방법으로 숙련도에 영향을 받으며, 협조가 되지 않는 환자에게는 정확한 검사를 시행하기 어렵다.10 또한 사시각을 직접 측정하기 때문에 병원을 옮기거나 담당 의사가 바뀌는 경우에 검사자 간의 오차에 의해서 사시의 악화 정도를 정량적으로 파악하기 힘든 점은 치료를 계획하려는 안과의사에게는 부담이 될 수 있다.
검사자가 하는 수동검사를 기계적으로 자동 측정되는 의료기기 검사로 대체한다면 검사자의 숙련도에 관련없이 자동으로 사시를 진단할 수 있고, 사시각에 대한 객관적인 데이터를 확보할 수 있을 것으로 생각한다.
안구운동을 기록하고 분석하는 방법으로 안구운동사진, 공막탐지코일법 및 비디오안구운동검사(video-oculography)가 있다.11,12 비디오안구운동검사를 이용하여 교대가림검사를 통해 얻어진 측정값과 프리즘교대가림검사를 이용하여 구한 사시각이 유의하게 일치한다고 확인되었지만, 굴절렌즈와 자동화된 교대가림장치를 장착할 수 없고 휴대가 용이하지 않아 임상에서 사시의 스크리닝 용도로 간편하게 사용하기에 구조적인 제한점을 가지고 있다.13
반면 Tobii pro glasses 2 (TPG2; Tobii Technology Inc., Stockholm, Sweden)는 웨어러블 아이트래커로 각각의 카메라가 안경 프레임의 안쪽면에 부착되어 두 눈의 움직임을 독립적으로 촬영할 수 있고, 내장되어 있는 동공추적장치(pupil tracking system)를 이용하여 안구움직임 변화를 측정하고 3차원 시축의 움직임을 X, Y, Z 좌표의 벡터값으로 분리하여 각각 표시된다(Fig. 1A). 휴대가 가능하고, 시축을 가리는 구조물이 없어 굴절렌즈와 교대가림장치를 장착할 수 있는 구조적 장점을 가지고 있지만(Fig. 1B), 아직까지 TPG2에서 사시각 측정에 대한 객관적인 연구가 없어 정략적인 측정을 하기 힘든 제한점이 있다.
따라서 본 연구에서는 의료기기로 대체하기 위한 첫걸음으로 안경 타입의 아이트래커(TPG2)를 착용하고 프리즘으로 안구편위를 유도한 후 안구편위각의 변화 데이터를 추출하였다. 프리즘으로 유도된 안구편위를 라벨링하여 안구 편위각 수치에 상관없이 ‘데이터 변화 패턴’을 머신러닝 프로그램으로 훈련시켜 사시 유무를 진단하고 그 유효성을 알아보고자 한다.
대상과 방법
2021년 4월부터 2022년 12월까지 정상 성인 지원자 11명을 전향적으로 조사하였다. 나안시력 20/25 이상, 자발적으로 검사에 지원한 정상 성인을 대상으로 선정하였다. 사시를 유발할 만한 전신 또는 안과적 질환을 가지거나 사위, 사시 및 안구운동이상이 있는 경우 대상자에서 제외하였다. 또한 검사 협조도가 낮은 경우에도 대상에서 제외하였다.
오른쪽 눈에 프리즘을 댈 때 프리즘의 뒷면이 항상 이마면 위치가 될 수 있게 가이드를 할 수 있는 렌즈프레임을 제작하여 TPG2에 장착하였다. 프리즘의 뒷면의 양 끝이 렌즈프레임의 앞부분에 모두 접촉하게 하여 눈과 프리즘의 뒷면이 항상 같은 각도가 이루어 지도록 유지하였고, 각막과 프리즘 후면 사이의 거리는 1.5 cm이다(Fig. 1C). 또한 TPG2를 착용한 대상자는 검사 동안에는 얼굴돌림이나 기울임이 없도록 같은 자세를 유지시켰다. 검사에 앞서, 캘리브레이션(calibration) 과정을 거쳤으며, 1.5 m 거리에서 흰색 바탕의 검은색 원이 그려진 카드를 수초간 주시하여, TPG2 프로그램에서 승인되면 검사를 시행하였다.
검사자는 대상자의 오른쪽 눈에 프리즘을 댄 후 정면에 있는 4 m 거리에서 스넬렌 20/30 시표를 바라보게 하여 프리즘 각도만큼 안구편위를 유발시키게 된다. 5초간 시표를 바라본 후 프리즘을 제거하고 다시 5초간 정면의 시표를 바라보게 하여 안구의 움직임을 기록하였다(Fig. 2). 2, 3, 4, 5, 6, 8, 10, 12, 15, 20, 25, 30, 35, 40 프리즘의 기저부를 안쪽, 바깥쪽 두 방향으로 안구편위를 유도하여 총 28종류의 안구편위 세트에서 X축 벡터값을 추출하였다.
머신러닝 과정은 데이터 형태 확인, 데이터 전처리, 데이터 준비, 모델 생성, 모델 평가, 모델 적용의 일련의 과정을 거쳐서 시행하였다. 얻어진 데이터에서 비정상값(상, 하위 20%)을 제외시키는 전처리과정을 시행하였다. 각 세트에서 안구편위 전후 20개의 데이터를 오버샘플링 기법으로 랜덤 추출 및 조합하여 총 61,600개의 안구편위 세트를 만들었다(Fig. 3). 그 중 56,000개의 훈련 세트에 프리즘양과 방향을 라벨링(labeling)하여 머신러닝(XG Boost)을 사용하여 훈련하였고 5,600개의 테스트 세트를 통해 민감도, 특이도, area under the curve (AUC)를 측정하였다.
본 연구에서는 8 PD 이하의 사시를 ‘비사시’, 8 PD 초과의 사시를 ‘사시’로 정의하였고, 20 PD 이상의 사시를 ‘의미 있는 사시’로 정의하였다. 머신러닝된 모델의 테스트는 2가지 조건에 대해서 머신러닝 모델의 정확도를 측정하였다. 첫 번째, 8 PD 기준 두 구간의 안구편위를 분석하여 사시와 비사시를 구분할 수 있는지, 두 번째로 8 PD 이하, 8-20 PD, 20 PD 초과의 세 구간의 안구편위를 분석하여 사시유무 및 수술이 필요한 의미있는 사시를 구분할 수 있는지 평가하였다.
본 연구는 인제대학교 부산백병원 임상연구관리규정과 헬싱키선언을 준수하였고, 모든 환자에서 본 연구 및 검사에 대해 충분히 설명을 한 뒤 서면 동의서를 받았다(인제대학교 부산백병원 임상시험윤리 위원회 승인번호: 2021-04-024-017).
결 과
총 연구 대상자는 11명으로 평균 연령은 34.8 ± 7.37세였고 남성이 5명, 여성이 6명이었다. 8 PD를 기준으로 두 구간을 분석한 경우, 8 PD 초과를 진단하는 민감도 0.95, 8 PD 이하를 진단하는 특이도 1.0를 보였다(Fig. 4A, B). 또한 AUC는 0.97을 보였다(Fig. 4C).
8 PD 이하, 8-20 PD, 20 PD 초과 세 구간을 기준으로 각 구간에 대한 민감도, 특이도 조사에서, 8 PD 이하의 구간에서는 민감도 0.90, 특이도 0.95로 측정되었다. 8-20 PD의 구간에서는 민감도 0.60, 특이도 1.00를 보였으며, 20 PD 초과 구간에서는 민감도 1.00, 특이도 0.88을 보였다(Fig. 5A, B).
8 PD 기준으로 예측 분포를 나타내는 히스토그램에서 8 PD 이하 구간(주황색)은 1에 가깝게 분포하고 있으며, 8 PD 초과 구간은 0에 가깝게 분포하며 AUC 1.00으로 측정되었다(Fig. 5C, D 좌측). 8-20 PD 구간(주황색)은 전반적으로 분포하고 있고, 8 PD 이하, 20 PD 초과 구간(파란색)은 0에 가깝게 분포하고 있으며 AUC 0.97로 측정되었다(Fig. 5C, D 중간). 마지막으로 20 PD 초과 구간은 1에 분포하고 있고 20 PD 이하 구간도 0에 가깝게 분포하고 있어 AUC 0.99로 측정되었으나 20 PD 이하 구간 중 일부도 1에 분포되어 있다(Fig. 5C, D 우측).
고 찰
사시는 소아에서 흔하며, 유병률은 전체의 5%의 빈도를 차지하는 질환이다.14,15 사시를 동반한 환자들은 약시, 양안시기능 감소 등 정상적인 시력발달이 어려우며,16-18 심리사회적 측면에서도 부정적인 자아상을 가지거나 대인관계에도 어려움을 겪는다.19-22 사시는 삶의 질을 크게 떨어뜨릴 수 있는 질환임에도 불구하고 간헐외사시, 조절내사시 등 특정한 사시의 특성상 평상시에는 눈의 정렬이 똑바로 되어 있는 경우가 많거나 육안으로 뚜렷하게 보이지 않는 소아에서는 검사를 하지 않아 뒤늦게 발견되거나 검사자의 오진으로 치료가 늦어지는 경우가 있다.
이러한 이유는 의사가 임상현장에서 직접 환자의 눈을 보면서 프리즘교대가림검사 등 수동적인 검사법으로 진단하는 것이 원인 중 하나로 저자들은 생각한다. 사시검사의 숙련도가 높지 않은 안과의사에게는 이런 검사법으로는 오진을 할 수 있고, 숙련된 안과의사라도 협조가 잘 되지 않는 소아에서는 오차가 클 수 있기 때문이다. 이런 한계를 극복하기 위해 최근 사진이나 비디오 장치를 이용하여 사시각을 측정하려는 시도가 있었다.23-27 환자들을 디지털 카메라로 촬영해 사진을 추출하여 사시유무 및 사시각을 분석할 수 있는 소프트웨어를 이용하거나25-27 비디오안구운동검사기, 가상현실기기(virtual reality-based measurement) 등의 아이트래커를 이용하여 안구편위를 분석하였다.13,28 가상현실기기를 이용한 사시각 측정은 내사시 환자에서 각도를 과대평가하고, 외사시 환자에서는 과소평가하는 경향을 보이거나,29 안구운동충돌을 유발하며 조절대비폭주비를 증가시키거나 근거리원거리사위에도 영향을 줄 수 있다고 보고하였다.30,31 또한 평균적인 머리 크기로 제작되었기에 소아를 포함하여 다양한 연령대의 환자에서 적용하기 어려우며, 폐쇄공포증이 있는 경우에도 적용하기 어려운 단점이 있다.13,32
본 연구에서는 기존의 검사기기가 소아나 폐쇄공포증이 있는 환자들에게 거부감을 줄 수 있다는 단점을 해결하기 위해 안경 타입의 아이트래커를 사용하였다. 연구에 사용된 TPG2는 눈 주위에 갇혀 있는 느낌이 들지 않아 검사가 용이하다는 장점이 있다. 본 연구는 새로운 타입의 아이트래커를 이용하여 안구편위를 측정하고, 머신러닝을 통하여 사시를 진단하려는 시도를 한 연구로서 의미가 있다.
프리즘교대가림검사는 한 눈 앞에 프리즘을 대고 가림을 시행하여 안구편위를 유발시킨 후, 가림을 반대쪽 눈으로 옮긴다. 이때 편위가 일어난 눈의 시축이 프리즘으로 굴절된 상과 일치되도록 눈이 움직이는데, 움직임이 없을 때까지 프리즘을 증감하여 더 이상의 움직임이 없을 때의 프리즘의 양이 사시각이 된다. 이는 프리즘양만큼 굴절시킨 정면의 상이 안구편위된 눈과 시축이 일치하기 때문이며, 프리즘으로 굴절시킨 각도가 결국 안구편위각이 된다. 즉 가림이 없어지면서 재주시 할 때 눈의 움직임을 확인하여 사시각을 측정하는 원리이다.
반면에 TPG2는 한 눈의 움직임을 촬영하는 2대의 카메라가 있으며, 동공추적 알고리즘을 이용하여 동공을 인식하고 3차원적으로 눈의 시축을 계산하여 안구편위각을 찾는 방식이다. 사시가 있을 때에는 한 눈을 가리면 가린 눈에 안구편위가 일어나게 되고, 카메라가 프리즘보다 눈 쪽에 가깝게 위치하며, 가림과 상관없이 두 눈의 안구편위를 벡터값으로 측정하게 된다. 반대눈을 가릴 때 재주시하기 위해 눈이 이동하게 되는데, 안구편위된 벡터값과 재주시한 눈의 벡터값의 차이를 안구편위각으로 정하였다. 이와 같은 원리로 비디오안구운동 검사기를 이용하여 간헐외사시를 측정한 연구가 보고되었는데, Park et al13은 공동외사시에서 비디오안구운동검사기를 착용하고 교대가림동안 카메라로 측정한 안구편위각과 프리즘교대가림검사 결과를 비교하였을 때 강한 양의 상관관계(R=1.000; p<0.001)가 있다고 하였고, Ban and Moon33은 간헐외사시에서 우세안과 비우세안의 안구편위각의 차이가 없다고 보고하였다.
본 연구는 수동으로 구간을 설정하여 안구편위각을 찾는 것이 아니라 데이터의 변화 양상에 대한 머신러닝 모델을 만들어 자동으로 안구편위각을 찾는 방법을 고안하였다. 머신러닝 모델은 프리즘으로 기저부 안쪽, 바깥쪽 두 방향으로 14개의 양이 다른 프리즘으로 28종류의 안구편위를 유도하였고, 안구편위 데이터세트에 유도시킨 프리즘 값과 방향을 라벨링하여 훈련시켰다.
8 PD 이하의 사시는 두 눈 단일시가 유지되지만,34 20 PD 초과의 사시는 외관상이나 기능적으로 이상이 생길 수 있어 수술을 권장하게 된다.35 따라서 본 연구에서는 8 PD 이하의 사시를 ‘비사시’, 8 PD 초과의 사시를 ‘사시’로 정의하였고, 20 PD 이상의 사시를 ‘의미 있는 사시’로 정의하였다. 먼저 훈련된 머신러닝 모델을 사용하여 테스트 세트를 통해서 8 PD를 기준으로 사시와 비사시를 구별할 수 있는지를 알아보았는데, 사시유무 판별에 대해서 민감도 100%, 특이도 95% 및 AUC 0.97로 사시 여부를 판단하는 스크리닝 검사로써 유용하다고 할 수 있다. 특히 실제 사시각이 8 PD 이하일 경우 머신러닝 모델이 100%에서 비사시라고 판단한다는 점이 강점이라고 저자는 생각한다.
두 번째로, 8, 20 PD를 기준으로 비사시, 사시, 의미 있는 사시를 분류하고 사시의 스크리닝과 수술이 필요한 정도의 사시 여부를 판단할 수 있는지를 알아보았다. 비사시, 사시, 의미 있는 사시의 세 구간을 판단하는 테스트에서는 의미 있는 사시를 진단하는 능력으로는 민감도 100%, 특이도 95%, AUC 0.97, 비사시를 진단하는 능력으로는 민감도 90%, 특이도 95%, AUC 1.00으로 높은 판단력을 가진다고 할 수 있다. 히스토그램에서 비사시와 사시의 분포(Fig. 5B 좌측)는 두 군 간에 잘 구분되어 있고, 의미 있는 사시 유무의 분포(Fig. 5B 우측)에서도 두 군 간에 잘 구분되어 있지만 소수의 의미 있는 사시가 아닌 경우에도 의미 있는 사시로 분류되어 있음을 알 수 있어 위양성이 존재할 수 있다. 그럼에도 불구하고 두 경우 모두 AUC 가 0.95 이상으로, 머신러닝 모델에서 비사시 또는 의미 있는 사시로 판단하는 경우에는 실제로 비사시 또는 의미 있는 사시일 가능성이 높아 스크리닝으로는 유용하다고 생각한다. 반면 8-20 PD 사시를 진단하는 능력에서는 민감도가 60%로 낮게 측정되었는데, 히스토그램에서 8-20 PD 사시 유무의 분포(Fig. 5B 중간)에서는 8-20 PD 구간(주황색)이 전체적으로 고루 분포되어 올바르게 예측하지는 못하지만 상대적으로 나머지 구간(파란색)이 일괄되게 분포되어 있어 AUC가 높게 측정되었다. 따라서 머신러닝을 사용하여 비사시와 의미 있는 사시에 한해서는 유의미하게 분류할 수 있을 것으로 저자들은 생각한다.
본 연구에서는 몇 가지 제한점이 있었다. 첫째, 참여자가 11명으로 적어 얻어진 안구편위 세트를 전처리 과정 및 오버샘플링하여 총 데이터 수를 61,600개로 해 한계점을 극복하려 하였다. 사시 유무를 구별하는 데 유용한 결과를 보여주었지만 프리즘의 양과 방향을 달리한 28개의 편위세트 각각의 안구편위를 정확하게 진단하는 능력은 현재 머신러닝 모델로는 정확도가 높지 않았다. 추후 충분한 데이터를 쌓는다면 정확한 사시각을 측정하기 위한 후속연구에 도움이 될 것으로 기대된다. 둘째, 아이트래커를 착용 후 프리즘 후면과 각막사이의 거리가 1.5 cm 정도로 기존 안경을 착용한 상태(1 cm)에 비하면 거리가 멀어졌다. 하지만 본 연구에서의 안구편위 유도는 프리즘을 이마면 위치에 놓고 시표를 바라보게 하여 거리에 따른 안구편위의 차이는 크지 않으며, 프리즘보다 각막에 인접한 안경의 안쪽면에 부착된 카메라로 안구편위를 측정하여 프리즘과 각막과의 거리에 따른 오차가 크지 않을 것으로 생각한다. 셋째, 소프트웨어 프로그램을 통해 안구편위를 분석하는 과정에서 데이터에서 갑자기 튀는 값들이 생겨났다. 이는 아이트래커의 한계점을 보여주는 것으로 동공추적장치가 동공의 중심을 인식하지 못하고 각막윤부를 인식하거나 다른 곳을 인식하는 경우가 있기 때문이다. 그래서 본 연구에서는 상하위 데이터의 20%를 제거하는 전처리과정을 거친 후의 데이터를 사용하였으며, 제거된 데이터를 보완하기 위해 오버샘플링 기법을 활용하였다. 오버샘플링 기법은 유도된 안구편위 데이터와, 프리즘 제거 후 데이터에서 각각 무작위로 20개의 데이터를 추출하고 무작위로 조합하여 61,600개의 데이터를 얻었다(Fig. 3).
그럼에도 불구하고, 사시를 진단하는 정확도는 97%, 의미 있는 사시를 진단하는 정확도는 99%로 사시에 대한 스크리닝 검사로는 유용하게 사용할 수 있을 것으로 기대한다.
대표적인 객관적인 사시검사법인 프리즘교대가림검사는 검사자가 직접 피검자의 눈을 보고 움직임 여부를 판단하는 방법이다. 하지만 The Pediatric Eye Disease Investigator Group은 2명의 숙련된 검사자에서 내사시 환자의 사시각 측정을 비교하였을 때 20 PD 이상의 사시각은 12 PD의 오차를, 20 PD 이하의 사시각에서는 6 PD의 오차를 보일 수 있다고 보고하였다.36 이는 한 명의 검사자에게 지속적으로 사시검사를 받는다면 사시의 변화를 확인할 수 있으나, 검사자가 바뀐다면 마지막 검사자가 사시의 악화 등을 결정하기가 쉽지 않다. 하지만 검사기기를 사용하면 검사자가 바뀌더라도 지속적으로 객관적인 검사를 할 수 있는 장점이 있다고 생각한다.
아직까지는 스크리닝 수준의 정확도를 가졌지만, 많은 안구편위 데이터로 머신러닝 모델이 개발된다면 좀 더 정확하게 사시각과 사시유형을 파악할 수 있을 것으로 생각한다. 아이트래커를 이용한 사시검사는 병의 진행 및 악화 정도를 일괄되게 파악하고 객관적으로 분석할 수 있어 적절한 수술 시기를 결정하는 데 유용하고 사시검사가 익숙하지 않은 의료진에서 오진율을 감소시킬 수 있을 것이다. 무엇보다 검사자가 직접 검사하는 것을 검사실에서 검사하는 방법으로 대체하여 한정된 진료시간에 병의 경과나 치료에 대한 설명에 많은 시간을 활용할 수 있을 것이다.
결론적으로 아이트래커를 이용하여 안구편위 데이터를 활용하여 스크리닝 머신러닝 모델을 개발하였으며, 사시 유무를 판단하는 스크리닝에 유용하게 사용될 수 있을 것이다. 또한 아이트래커를 이용한 안구편위의 객관적 데이터를 제공하여 사시를 진단하거나 수술 시기를 결정하는데 유용하게 사용할 수 있을 것이다.