Zoom In
‘데이터 디스커버리 경진대회’
수상팀을 만나다 2022 DATA DISCOVERY
빅데이터, AI 기술 등 디지털 변환 확산을 위한 ‘데이터 디스커버리 경진대회’가 10월 25일과 26일 이틀간 개최됐다. 데이터 디스커버리는 디지털변환 관련 우수과제를 선정하고 전사에 적용하는 데이터분석 경진대회로서 사업소 현장에서 과제를 발굴하고, 회사의 다양한 업무에서 생성된 데이터를 기반으로 사업소 직원들이 팀을 이루어 문제를 해결해낸 성과를 겨루는 대회다. 올해는 기존의 데이터분석 전 과정을 수행하는 ‘자체수행’ 분야 외에 ‘아이디어 제안’ 분야를 도입하여 더욱 많은 사업소의 참여가 있었다. 그 수상팀들을 만나본다.
자료제공 디지털변환처
광주전남본부 탄탄대로팀
다중현장 최적 이동경로 탐색모델
탄탄대로팀은 ICT설비의 문제해결을 위해 한 번에 다수의 현장을 방문해야 하는 경우가 많은데 동선을 효율적으로 잡는 것이 중요함을 착안해 과제를 수행하게 됐다고 한다. 현장에서의 실제적 필요를 파악하기 위해 설문조사, 타 기관 벤치마킹 등 철저한 사전조사를 바탕으로 과제의 방향과 틀을 정했다. 영배와 ERP에서 작업시간 관련 데이터를 추출하고 직원들이 주로 사용하는 내비게이션인 TMap API를 연계하여 실시간 교통정보 데이터를 수집했다. 20GB 용량의 데이터를 확보하기 위해 밤새 업무망 PC를 켜두고 파일을 추출해야 했다. 다중현장 최적 이동 경로 탐색 모델에서 사용할 알고리즘을 선정하기 위해 여러 논문을 참고하고 관련 서적과 자료 검색 등 상당한 시간이 소요됐다. 웹기반 프로토타입으로 실제 경로를 검색하고 출력하는 화면을 만들어 보여주고자 웹 서버를 사내망에 구축하고 외부 API를 받아오기 위해 DMZ에 프록시 서버도 구축했다.
이렇게 개발한 다중현장 최적 이동 경로 탐색모델은 출장 시 이동하는 소요 시간과 거리를 단축해 작업능률을 향상시킴은 물론 운영비를 연간 90억 원 가량 절감할 수 있다. 또한 운행거리 단축으로 탄소배출량을 감축해 연간 나무 18만 그루를 키우는 효과를 거둘 수 있다. 그리고 모든 경로를 한 번에 보여주기 때문에 운전 중 내비게이션 조작을 하지 않아도 돼 교통사고도 예방할 수 있다.
이들은 앞으로 이 모델을 현장에서 편하게 이용하도록 모바일 앱과 연동시키는 작업을 협의해 추진할 계획이란다.
인사처 HR Analytics팀
Transfer Learning 활용
다면평가 감정분류 예측 모델
‘그는 소통을 위해 노력하고 있다’ VS ‘그는 소통을 위한 노력이 필요하다’ 두 문장 안에서 노력이라는 단어는 맥락에 따라 다르게 해석된다. 인사혁신처 HR Analytics팀은 이처럼 맥락에 따라 바뀌는 단어의 의미조차 해석해내는 빅데이터 분석 모델을 다면평가에 적용하는 프로젝트를 제시해 최우수상을 수상했다. 우리 회사의 다면평가 서술형 자료는 3년간 축적된 데이터가 250만 개나 될 정도로 방대하지만 실제 활용방법에 대한 고민이 있었다.
구글에서 총 33억 단어를 학습시켜 배포한 BERT라는 모델을 활용하여 우리가 가진 문장으로 ‘전이’하는 전이학습(Transfer Learning) 방식을 통해 성공적으로 다면평가 문장의 맥락을 이해시킬 수 있었다. 이 맥락을 이해하는 방식을 통해 중립문장을 별도로 구별하고, 한국어의 특성까지 반영시켜 정확도가 99% 되는 감정분류 예측모델을 완성했다. 이는 올해 7월 특허 출원과 함께 9월에는 영국경영학회에서도 관련으로 발표요청이 와서 우리 회사 HR 분야의 우수성을 알릴 수 있었다.
이번에 개발한 다면평가 감정분석 모델을 통해 각 개인의 다면평가 결과를 나타낼 때 긍정/중립/부정 지표 변화를 시각적으로 한눈에 보여주고, 워드 클라우드에도 각 감정별로 어떤 단어 위주로 평가받았는지 분류해서 보이도록 할 예정이다.
또한 HR Analytics 팀과 데이터 사이언스 연구소가 공동 개발한 인재추천시스템 내 알고리즘에도 활용되었으며, 향후 감정분석 모델의 무한한 확장성에 기대를 모으고 있다.
부산울산본부 DA-DA팀
빅데이터를 활용한
업종별 미수채권 발생예측 모델
부산울산본부 DA-DA팀은 금리가 가파르게 인상되어 이자비용이 증가해 한계기업이 많이 발생할 경우를 위해 미납요금(이하 채권)관리를 개선할 필요를 느껴 본 과제를 시작하게 되었다.
이들이 개발한 과제는 수시로 전기요금을 연체하는 고객에 대해 나름의 신용을 평가해서 연체기간을 조정하기 위해 채권을 평가하는 모델이다. 이를 통해 궁극적으로는 우리 회사가 고객들을 상대로 하는 신용평가의 기초모델이 되어주길 기대하고 있다.
물론 실제로 현장에 적용하려면 약관개정 등의 여러 난관이 많이 있겠지만, 대외적으로 어려움을 겪고 있는 지금의 시점이 오히려 자구책 마련이라는 명분으로 논의해 볼 만한 적기일 수 있다고 이들은 강조한다. 이들의 결과물은 Excel을 이용해 프로토타입으로 만들어졌지만 앞으로 디지털변환처에서 전문성 있게 만들어 활용할 예정이란다. DA-DA팀도 현업 담당자들이 만족할 만한 솔루션이 될 수 있게 제작 과정에 최대한 협조하겠다며 의지를 다진다.