데이터 보안과 AI 효율성 동시에 높인 인공지능 기술 개발

[한국대학신문 박인규 기자] 숭실대학교(총장 이윤재) 전자정보공학부 권민혜 교수 연구팀(박사과정 김미르, 박희원)의 논문 ’Personalized Split Federated Learning with Early-exit: Pre-training and Online Learning Against Label Shifts’이 IEEE Internet of Things Journal에 게재됐다고 19일 밝혔다.

IEEE Internet of Things Journal은 국제전기전자공학회(IEEE)가 발행하는 사물인터넷(IoT) 분야의 국제저명학술지다.

왼쪽부터 권민혜 교수, 김미르(박사과정), 박희원(석사과정) 연구원(사진=숭실대)

권 교수 연구팀은 데이터를 외부로 내보내지 않고 스스로 학습하며 변화에 적응할 수 있는 인공지능(AI) 기술을 개발했다.

☞https://ieeexplore.ieee.org/document/11143204

이번 연구는 각 IoT(사물인터넷) 기기가 원본 데이터를 공유하지 않고도 협력적으로 학습할 수 있는 개인화 연합학습(Personalized Federated Learning) 구조를 제시했다. 이를 통해 개인정보 유출 위험을 최소화하면서도 학습 효율성과 정확도를 동시에 높였다.

기존 인공지능 시스템은 모델 학습을 위해 데이터를 중앙 서버에 모아야 했으나, 이 방식은 개인정보 유출과 통신비용 증가, 기기 성능 제약 등 여러 한계를 지니고 있었다.

권 교수 연구팀은 이러한 문제를 해결하기 위해 각 IoT 기기가 자체 데이터를 기반으로 모델 일부를 독립적으로 학습하고, 서버에는 암호화된 손실값(loss value)만 전송하는 방식을 고안했다. 이로써 데이터는 단 한 번도 외부로 유출되지 않으면서 서버와 다수의 기기가 협력해 하나의 고성능 AI를 공동 학습할 수 있게 됐다.

이번 연구의 핵심은 서버가 정답 데이터(라벨)을 직접 받지 않아도 학습이 가능한 ‘대리 타깃(surrogate target)’ 생성 기법이다. 이를 통해 기존 연합학습의 주요 취약점이던 라벨 공유에 따른 프라이버시 침해 문제를 근본적으로 차단했다. 그 결과 학습 효율을 유지하면서도 데이터 보안성이 강화됐으며, 통신량은 절반 이하로 줄었다.

(a) 사전 학습과 (b) 온라인 학습 단계로 구성된 모델 구조로, 데이터를 서버와 공유하지 않아 보안성이 높다.(사진2=숭실대 제공)
(a) 사전 학습과 (b) 온라인 학습 단계로 구성된 모델 구조로, 데이터를 서버와 공유하지 않아 보안성이 높다.(사진=숭실대 제공)

연구팀은 ‘온라인 적응 학습(Online Learning)’ 구조도 도입해 환경 변화가 실시간으로 발생하는 상황에서도 안정적인 성능을 유지하도록 설계했다.

기존의 정적 학습 모델은 변하는 환경을 반영하지 못해 성능이 떨어지는 한계가 있었다. 이에 권 교수 연구팀은 AI가 학습 패턴을 스스로 조정하는 온라인 학습과 서버의 대형 모델이 각 기기에 지식을 전달하는 지식증류(Knowledge Distillation) 방식을 결합해 문제를 해결했다.

그 결과 각 기기는 별도의 서버 연결 없이 스스로 수집한 데이터를 기반으로 모델을 실시간 보정하면서 전체 시스템의 지식을 공유할 수 있게 됐다.

특히 권 교수 연구팀은 ‘얼리-엑시트(Early-exit)’ 구조를 도입해 서버 도움 없이도 빠르게 결과를 예측할 수 있도록 했다. 이는 자율주행차나 네트워크가 불안정한 산업 현장에서 유용하게 활용될 수 있다.

시뮬레이션 결과, 제안된 기술은 기존 연합학습 및 스플릿러닝 방식 대비 평균 18.5% 높은 정확도를 보였으며, 데이터 분포가 변화하는 상황에서는 최대 30.9%까지 성능이 향상됐다. 또한 통신량은 약 40~60% 감소, 학습 속도와 안정성 역시 크게 향상됐다.

이 같은 연구 성과는 엣지 디바이스 기반 AI 시스템의 보안·효율·지연시간 문제를 동시에 해결할 실질적 대안으로 평가된다.

김미르 학생은 “이번 연구는 각 기기가 자신의 데이터를 외부에 노출하지 않으면서 변화하는 환경에 실시간으로 적응할 수 있는 고성능 AI 구조를 제시한 것”이라며 “자율주행·제조·의료 등 데이터 보호와 신뢰성이 중요한 산업에서 AI 실용화를 앞당길 수 있을 것”이라고 말했다.

박희원 학생은 “이번 연구가 중앙서버에 의존하는 기존 AI 구조에서 벗어나 스스로 학습하고 협력하는 AI로 전환하는 계기가 되길 바란다”고 밝혔다.

이번 연구는 정보통신기획평가원(IITP)의 ‘분산·협력 AI 기반 5G+ 네트워크 데이터 분석 기능 및 제어 기술 개발’ 과제의 지원으로 수행됐다.

 

저작권자 © 한국대학신문 무단전재 및 재배포 금지