Transfer Learning 활용
다면평가 감정분류 예측 모델
‘그는 소통을 위해 노력하고 있다’ VS ‘그는 소통을 위한 노력이 필요하다’ 두 문장 안에서 노력이라는 단어는 맥락에 따라 다르게 해석된다. 인사혁신처 HR Analytics팀은 이처럼 맥락에 따라 바뀌는 단어의 의미조차 해석해내는 빅데이터 분석 모델을 다면평가에 적용하는 프로젝트를 제시해 최우수상을 수상했다. 우리 회사의 다면평가 서술형 자료는 3년간 축적된 데이터가 250만 개나 될 정도로 방대하지만 실제 활용방법에 대한 고민이 있었다.
구글에서 총 33억 단어를 학습시켜 배포한 BERT라는 모델을 활용하여 우리가 가진 문장으로 ‘전이’하는 전이학습(Transfer Learning) 방식을 통해 성공적으로 다면평가 문장의 맥락을 이해시킬 수 있었다. 이 맥락을 이해하는 방식을 통해 중립문장을 별도로 구별하고, 한국어의 특성까지 반영시켜 정확도가 99% 되는 감정분류 예측모델을 완성했다. 이는 올해 7월 특허 출원과 함께 9월에는 영국경영학회에서도 관련으로 발표요청이 와서 우리 회사 HR 분야의 우수성을 알릴 수 있었다.
이번에 개발한 다면평가 감정분석 모델을 통해 각 개인의 다면평가 결과를 나타낼 때 긍정/중립/부정 지표 변화를 시각적으로 한눈에 보여주고, 워드 클라우드에도 각 감정별로 어떤 단어 위주로 평가받았는지 분류해서 보이도록 할 예정이다.
또한 HR Analytics 팀과 데이터 사이언스 연구소가 공동 개발한 인재추천시스템 내 알고리즘에도 활용되었으며, 향후 감정분석 모델의 무한한 확장성에 기대를 모으고 있다.