-
사업자등록번호 : 108-82-05120 | 대표자 : 유하진 | 단체명 : (사)한국음성학회
(06252) 서울특별시 강남구 강남대로 320 5층 (역삼동, 황화빌딩) LS26 (사)한국음성학회 - +82-070-8275-2821 +82-505-837-7169 ksss@speechsciences.or.kr
[실험음성학연구회] 3월 강독회 발표
한국음성학회 2018-09-10 18:55 3158//갤러리 화면 따로 if ($b_name == 'bo_gallery') { // 선 이미지 후 내용 ?>
◈ 실험음성학연구회 3월 강독회 발표
장소: 대우재단빌딩 세미나 B실
일시: 3월 21일 (토요일) 10:30-1:00
<발표 제목>: 한국어 자연발화 음성코퍼스
<저자>: 윤원희, 윤규철, 박선우, 이주희, 조성문, 강덕수, 변군혁, 한혜승, 김정선
<발표자>: 윤원희, 윤규철 외
<논문 개요>
본 연구는 한국어 서울 방언의 자연 발화 음성 코퍼스를 구축을 위해, 40명분의 소리 파일을 녹음하고, 각 음성 파일에 대하여 어절별, 음소별로 표기된 레이블 파일, 및 코퍼스 검색 도구를 연구용으로 무료 배포 하는 것이다.
자연발화는 통제발화나 낭독체 발화에 비하여 변이성이 높다. 즉 음소배열과 음운현상 등이 예기치 않게 나타나기도 하지만 일상적으로 인간이 사용하는 언어 형태를 가장 잘 반영한다고 볼 수 있다.
녹음 대상으로는 10대, 20대, 30대, 40대 각각 10명씩을 정하였고, 각 세대별로 남녀를 각각 5명씩 녹음하였다. 녹음 완료된 파일들을 대상으로 후처리를 거쳐 자동음성인식의 부수적 과정인 강제정렬을 통해 자동레이블링을 생성하였다. 자동으로 생성된 음소별 레이블은 다시 연구원들에 의해서 수동으로 음소경계에 대한 미세 조정 작업이 진행되었다. 녹음된 인터뷰 시간은 약 40시간 이었으며, 총 1,135,263개의 음소에 대한 수동레이블이 완성되었다.
참여한 9명의 레이블러들 사이의 음소 일치도를 계산하여 레이블의 정확성을 검증하였다. 이를 위해, 8분간의 테스트 음성을 수동 레이블 한 결과 98.1%의 일치도를 보였으며, 음소경계에 대한 레이블러들 사이의 오차는 평균 9.04msec 이었다.
<<공지>>
발표 후 라이센스 동의서 서명과 함께 코퍼스 DVD를 선착순으로 약 40여명에게 무료 배포하오니 많은 참여 바랍니다.
만일 수요가 더 많을 경우 추후에 코퍼스 파일을 받을 수도 있습니다.
연구용으로만 무료 배포를 하고, 상용 목적일 경우 따로 연락을 주시기 바랍니다.
[한국음성학회] 실험음성학연구회 동계워크숍 안내 (1/11 등록 마감)
실험음성학연구회 2025 동계 워크숍 (클릭하시면 공지사항으로 이동됩니다.)







