본문 바로가기

Board/News

AI 학습 데이터 활용 해커톤 대회 2건에서 각각 1등상 수상 쾌거

대학원 인공지능학과 구명완 교수 연구팀,

AI 학습 데이터 활용 해커톤 대회 2건에서 각각 1등상 수상 쾌거

 

 (위 왼쪽부터) 백지수, 이지현 석사과정생

(아래 왼쪽부터) 최예린, 이정필, 장재후 석사과정생

 

구명완 컴퓨터공학과(대학원 인공지능학과) 교수가 지도하는 지능형음성대화인터페이스연구실(ISDS) 소속 대학원 인공지능학과 석사과정생들이 2건의 과학기술정보통신부(이하 과기정통부’)·한국지능정보사회진흥원(NIA) 주최 인공지능(AI) 학습 데이터 활용방안 해커톤 대회에서 각각 1등상을 수상했다.

 

대학원 인공지능학과 석사과정 백지수·이지현 학생(팀명 ‘ISDS’) 언어 교육용 서양어, 아시아어 사용자의 한국어 음성 데이터 AI 학습 데이터 활용 해커톤’(이하 외국어 사용자 한국어 음성 해커톤’)에서 최고상인 금상과 상금 100만 원을 받았다. 이들은 지난 11 18() 서울대에서 진행된 2차 심사(본선)에서 경쟁팀 10팀 중 1위를 차지했다.

 

백지수·이지현 학생은 범용적으로 사용되는 음성인식기 성능 평가 도구 SCTK를 활용하여 한국어 학습자의 모국어권별로 음소 오류 패턴을 자동 분석하는 방안을 제안했다. 또한, 이 방법론으로 직접 외국인 한국어 학습자의 모국어에 따라 자주 등장하는 음소 오류를 분석하고, 분석 결과가 통계적으로 유의하다는 검정 결과를 보였다. 더 나아가 동·서양어 언어권별로 외국인 학습자 맞춤형 발음 훈련에 활용할 수 있다는 활용방안을 제시하여 우수한 평가를 받았다.

 

백지수·이지현 학생은 학부에서 각각 일어일문학과 언어학을 전공한 문과 출신으로, 올해 상반기 인공지능학과 1기로 입학했다. 백지수 학생은 학부 시절 익힌 외국어 및 언어학 지식과 대학원에서 배운 공학적 지식을 융합해 시너지 효과를 낼 수 있었던 것 같아 뿌듯하다라며, “앞으로도 넓은 시야로 학문의 지평을 넓히겠다라고 말했다.

 

 이지현·백지수 인공지능학과 석사과정생(왼쪽 및 가운데)

언어 교육용 서양어, 아시아어 사용자의 한국어 음성 데이터 AI 학습 데이터 활용 해커톤 시상식 기념사진(11/18)

 

같은 연구실의 이정필·이지현·장재후·최예린 학생(팀명 코드 제로(Code Zero)’) ‘AI Hub 학습데이터 기반 해커톤 대회 분야 2(AI Hub 학습 데이터 활용 사업화)에서 대상과 상금 200만 원을 수상했다. 이들은 방대한 양의 한국어 음성 데이터셋에 대해 품질 측정과 개선을 자동화할 수 있는 프레임워크를 제안해 17팀 중 1위에 올랐으며, 시상식은 지난 11 22() 광주CGI센터에서 진행되었다.

 

코드 제로 팀은 고성능 발음 기반 음성인식기로 사람의 노력을 최소화하면서 음성 데이터를 정제하는 방법을 제안했다. 일반적으로 음성 데이터는 양이 방대해 사람이 일일이 정제하기 어려워 품질 관리가 쉽지 않다. 이들은 AI Hub 공개 데이터셋 중 한국어 일반 대화 음성 데이터셋 ‘KSponSpeech’의 훈련 데이터를 이용해 테스트셋 기준 문자 오류율 8~9%을 나타내는 발음 기반 음성인식 모델을 개발했다. 아울러 이 모델을 활용한 Human-in-the-loop 방식(사람이 AI 학습에 피드백을 주는 방식)으로 테스트셋 3,000건 중 주석 오류를 178(5.9%) 걸러내 방법론에 효과가 있음을 보였다.

 

이정필 학생은 이번 대회에서 AI Hub 공개 데이터를 활용한 인공지능 사업화 방안을 많이 고민해 보았다라며, “아이디어도 중요하지만 이에 걸맞은 데이터 처리 및 모델 학습을 위한 기술이 필요하다는 점을 느꼈다라고 전했다.

 

 장재후 인공지능학과 석사과정생(왼쪽)

‘AI Hub 학습데이터 기반 해커톤 시상식 기념사진(11/22)

 

 

출처 : 서강피플(https://www.sogang.ac.kr/gopage/goboard2.jsp?bbsConfigFK=58&pkid=535657)