-
사업자등록번호 : 108-82-05120 | 대표자 : 정현성 | 단체명 : (사)한국음성학회
(08787) 서울 관악구 남부순환로 1808, 2층 1호(봉천동, 관악센츄리타워) (사)한국음성학회 - +82-070-8275-2821 +82-505-837-7169 ksss@speechsciences.or.kr
[실험음성학연구회] 4월 강독회 안내
배미영 2019-04-15 09:48 2611//갤러리 화면 따로 if ($b_name == 'bo_gallery') { // 선 이미지 후 내용 ?>
한국음성학회 회원 여러분들께;
안녕하세요 실험음성학연구회 손민정입니다. 4월 강독회는 충남대학교 성철재 교수님께서 강의해 주십니다. 금번 강독회에서는 음성자료를 이용한 기계학습에 대하여 배우는 시간을 마련하였습니다. 개인 노트북을 이용한 실습 세션 없이 강의만으로 진행되오니 간편히 메모할 것만 가지고 와주십시오. 흥미롭고 유익한 강의가 준비되어 있으니 관심있는 많은 회원분들이 함께 하실 수 있기를 바랍니다.
◎ 일자: 2019년 4월 20일 토요일
◎ 시간: 10:30 ~ 13:00시
◎ 장소: 대우재단빌딩 (서울역 인근) 7층 세미나 2실
※ 참고사항: 봄학기 회비 없음
[제목]
음성데이터와 머신 러닝 - R code를 이용한 svm (support vector machine), randomForest, & k-means clustering
[내용]
기계 학습(machine learning)이 필요한 대표적인 두가지 작업을 들어보라면 데이터의 예측(prediction)과 분류(classification)다. 예측 작업에 사용되는 대표적 통계 방법으로 선형회귀를 들 수 있고, 분류를 위한 통계 방법으로는 svm (support vector machine), random forest, logistic regression, linear discriminant analysis, 그리고 k-means clustering 등을 들 수 있다. 분류 알고리듬 5가지 중 먼저 열거한 4가지는 집단 정보 레이블을 미리 제공하고 분류 작업을 진행하는 지도(supervised) 학습 방법이고, 마지막에 예시한 k-means clustering은 아무런 정보가 없이, 즉 분류 집단에 대한 답지를 제공하지 않고 진행하는 비지도(unsupervised) 학습 방법이다. 이번 강의에서는 이러한 아이디어를 바탕으로 아래와 같은 작업을 진행해볼 것이다.
1. 과소비성(Hyponasality) 증상을 보이는 소아(4;4-9;11) 아데노이드비대 환자와 앨러지성 비염 환자의 음성 데이터를 대상으로 svm과 random forest 알고리듬이 유효하게 적용되는지 살펴본다. 두 집단의 비성도(nasalance measured by Nasometer) 차이는 통계적으로 유의하지 않다. 비성도가 차이 나지 않으므로 음향변수만으로 두 집단을 구분하는 작업이 어려울 것이라는 점은 충분히 예상가능하다.
2. k-means clustering을 이용하여 65세 이상 여성의 말속도를 두 집단으로 구분하는 작업을 시도한다. 65세에서 85세에 이르는 다양한 말속도 데이터를 입력하여 말속도(x)와 연령(y)간 회귀방정식을 구하고, 이 방정식에 k-means clustering 결과로 구해지는 두 집단 경계 말속도를 입력한다. 연령집단이 두 집단으로 구분되고 말속도를 이용한 새로운 노년 진입 연령을 예측해볼 수 있다.