마이크로부터 음성을 샘플링 하였다면 어떻게 음성인식을 수행하는 걸까...
일단 ADC를 하였다면 샘플링은 끝난것이다.
음성인식을 위해서는 이제 특징벡터를 추출하고 인식어휘를 훈련하는 과정이 필요하다. 이 때 사용되는 알고리즘은 크게 HMM, DTW, NNet등이 있고 음성인식의 특징벡터는 MFCC, LPCC가 있는데 MFCC가 더 많이 쓰인다.
이 알고리즘을 통해 인식어휘를 훈련하여 특징벡터를 얻은 후 이제 마이크로 입력된 음성으로부터 동일방식으로 특징벡터를 얻어서 두 데이터를 비교하여 가장 근접한 대상어휘를 인식결과로 출력하면 된다.
여기서 중요한것은 바로 이 인식어휘를 확보하여 DB로 구축하는것이다.
자신의 음성을 인식하고자 한다면 자신의 음성으로 특징벡터를 구하여 DB를 구축하면 된다.
여러사람의 음성을 인식하고자 한다면 여러사람의 음성으로 특징벡터를 구하여 DB를 구축하면 된다.
참고서적
Multimedia Sound Programming : 영진출판사 한학용,하성옥,허강인공저
음성언어정보처리 : 홍릉과학출판사 오영환저