기타/Sound technology2011. 3. 18. 09:59

마이크로부터 음성을 샘플링 하였다면 어떻게 음성인식을 수행하는 걸까...

일단 ADC를 하였다면 샘플링은 끝난것이다.
음성인식을 위해서는 이제 특징벡터를 추출하고 인식어휘를 훈련하는 과정이 필요하다. 이 때 사용되는 알고리즘은 크게 HMM, DTW, NNet등이 있고 음성인식의 특징벡터는 MFCC, LPCC가 있는데 MFCC가 더 많이 쓰인다.

이 알고리즘을 통해 인식어휘를 훈련하여 특징벡터를 얻은 후 이제 마이크로 입력된 음성으로부터 동일방식으로 특징벡터를 얻어서 두 데이터를 비교하여 가장 근접한 대상어휘를 인식결과로 출력하면 된다.

여기서 중요한것은 바로 이 인식어휘를 확보하여 DB로 구축하는것이다.

자신의 음성을 인식하고자 한다면 자신의 음성으로 특징벡터를 구하여 DB를 구축하면 된다.
여러사람의 음성을 인식하고자 한다면 여러사람의 음성으로 특징벡터를 구하여 DB를 구축하면 된다.

참고서적 
  Multimedia Sound Programming : 영진출판사 한학용,하성옥,허강인공저
  음성언어정보처리 : 홍릉과학출판사 오영환저
 
Posted by 삼스

댓글을 달아 주세요

  1. 눈을 감아봐 입가에 미소가 떠오르면 네가 사랑하는 그 사람이 널 사랑하고 있는거야.

    2013.07.14 00:46 [ ADDR : EDIT/ DEL : REPLY ]