이동수 (사)한국빅데이터진흥원 대표이사·한국정책전략연구원 원장

이동수 대표가 제1기 미래대학 콜로키엄 9주차 일정이 진행된 22일 '실무중심 데이터 분석'을 주제로 발표하며 DEA 분석에 대해 설명하고 있다.
이동수 대표가 제1기 미래대학 콜로키엄 9주차 일정이 진행된 22일 '실무중심 데이터 분석'을 주제로 발표하며 DEA 분석을 설명하고 있다.

[한국대학신문 허지은 기자]빅데이터가 나보다 나를 더 잘 아는 시대다. 이제 인간의 모든 생활은 데이터화되고, 방대한 양의 데이터를 분석해 각 개인의 성향을 파악하고 행동 패턴을 예측할 수 있다. 기업에서는 빅데이터를 분석해 고객층을 파악하고 타깃 마케팅을 벌인다.

미래사회, 그리고 미래대학을 예측하기 위해서도 데이터는 중요한 자원이 된다. 교육 수요자와 교육 환경 등 데이터가 될 수 있는 모든 변수는 미래예측의 근거이기 때문이다. 22일 2019 제1기 미래대학 콜로키엄 9주 차에는 미래대학을 예측하기 위한 빅데이터 분석 방법에 대해 이동수 (사)한국빅데이터진흥원 대표이사가 강연을 진행했다.

이동수 대표는 “데이터를 모을 수 있는 방법이 다양해졌다. 눈으로 보이지 않는 데서도 데이터를 모을 수 있게 됐다”면서 “날씨도 데이터의 하나다. 지금은 기상청에서 무료로 데이터를 제공하고 있지만 앞으로는 돈을 주고 이것을 사는 날이 올 것”이라고 말했다.

또한 서로 다른 데이터를 합쳐 분석하면 새로운 정보를 얻을 수 있다고 말했다. 이 대표는 “스마트폰을 통해 위치데이터를 파악하면, 사용자가 어디를 얼마나 자주 갔는지 알 수 있다. 여러 사람의 데이터를 기반으로 이를 날씨 데이터와 연결해 분석하면 어떤 날씨에 어떤 사람들이 어느 지역으로 이동하는지를 다 알 수 있다”고 설명했다.

교육에서도 빅데이터 분석은 폭넓게 사용될 수 있다. 이 대표는 “학생들의 위치 데이터를 얻으면 어디를 자주 가는지, 어떤 때 어떤 행동 패턴을 보이는지 알 수 있다. 결국 그 사람의 성향을 알 수 있다. 이렇게 얻은 정보를 바탕으로 학생을 맞춤식으로 지도하는 것이 가능하다”고 덧붙였다.

그리고 이러한 정보를 얻을 수 있는 빅데이터 분석은 누구나 가능하다. 과거에는 빅데이터를 저장하는 공간도, 이를 분석하는 툴(tool)도 모두 고가였지만, 데이터를 구하기도 쉬워졌을 뿐 아니라 분석 툴 역시 오픈소스로 제공되고 있기 때문이다.

이 대표는 기업에서도 오픈소스를 활용해 데이터를 저장하고 분석하고 있다고 설명했다. 그의 설명에 따르면 IBM, 오라클 등 세계적 기업들이 현재 이러한 방식을 사용하고 있으며 인터넷 뱅킹 업체 역시 데이터 관리자와 서버관리자 각각 한 명씩 총 두 명만으로 시스템을 운영할 수 있을 만큼 데이터와 데이터 분석 기술은 가까운 곳에 있다.

이 대표는 “데이터는 원료”라며 “과거 농업시대에는 토지가 부를 축적할 수 있는 바탕이 됐다. 이제는 데이터가 돈이 되는 시대”라고 설명했다.

또한 그는 이날 여러 빅데이터 분석 중에서도 ‘텍스트마이닝 분석’을 소개했다. 텍스트마이닝 분석이란 대규모의 문서에서 의미 있는 정보를 추출하는 것으로 정보 검색, 데이터마이닝, 기계학습, 통계학, 컴퓨터언어학 등이 결합됐다. 문서 분류와 문서 군집, 메타데이터 추출, 정보추출 등에 텍스트마이닝 분석이 활용된다.

텍스트마이닝은 비정형 데이터와 반정형 데이터를 분석해 유용한 정보를 추출하고 자연언어로 처리해 제공한다. 대량의 텍스트로부터 과거에 알려지지 않은 숨겨진 지식을 찾아낼 수 있다. SNS의 새로운 이슈에 대한 연관어 분석이나 해외 및 국내여행지 트렌드를 분석해 소비자에게 맞는 여행지를 추천해줄 수도 있다. 특히 학술지의 특성을 파악하고 핵심 키워드를 파악해 연구 동향을 분석할 수도 있다.

텍스트마이닝을 통해 데이터를 분석할 경우 ‘의미연결망 파악’을 통해 연관단어를 추출하고 데이터 간의 의미를 찾을 수 있다. 비슷한 의미를 갖는 단어는 문서에서도 가깝게 존재한다는 가정에 따라 문서 내의 단어 간 거리를 바탕으로 매핑하는데, 이를 의미연결망으로 표현하면 상호 관련이 깊은 단어들을 추출할 수 있고 주요 키워드와 키워드 간 관계성을 파악할 수 있다.

DEA 분석도 소개됐다. 자료포락분석을 뜻하는 DEA는 하나 이상의 산출물과 하나 이상의 투입물로 이뤄진 의사결정단위를 유사한 속성으로 지니고 있는 집단 내에서 평가하는 상대적 평가 기법이다.

쉽게 말해 대학을 의사결정단위로 본다면 집단 내 유사성을 갖고 있는 평가 대상들은 학과가 된다. 이 학과를 상대적으로 평가해 A학과가 벤치마킹할 학과의 특성이 무엇인지 알 수 있는, 단위 간 비교를 통한 평가 방식이다.

이 대표는 “대학 교육행정에서 DEA 분석을 실시할 경우 대학 내 기구들이 얼마나 효율성 있게 운영되고 있는지, 대학을 혁신하려고 할 때 이에 각 기구들이 어떻게 대응해야 하는지, 대응을 효과적으로 할 수 있는 지도 알 수 있다”고 설명했다.

학과별 DEA 분석 시에는 학생정원‧예산‧교직원 수‧강의실‧장학금 등이 투입요소로, 성적‧취업률‧상담 건수‧교육 만족도‧학습성과 달성 등이 산출 요소로 들어가 효율성을 파악할 수 있다.

DEA 분석의 실제사례도 소개됐다. 이 대표가 직접 전국 198개 특구를 광역단위로 묶어 분석한 결과가 제시됐다. 어느 광역 지자체가 참고할 만한 다른 광역 지자체는 어디인지, 그 효과성은 얼마인지가 수치로 나타났다.

이 대표는 “데이터 분석은 다양한 분야에 적용될 수 있다”면서 “대학의 전략, 발전계획을 세울 때도 이제는 생각이나 추측만으로 논의하는 것이 아니라 데이터를 근거로 정확한 판단을 내릴 수 있다”고 밝혔다.

저작권자 © 한국대학신문 무단전재 및 재배포 금지