'Speech input'에 해당되는 글 1건

  1. 2010.03.17 Developer Blog: Speech Input API for Android
Android/App개발2010. 3. 17. 16:23
http://android-developers.blogspot.com/2010/03/speech-input-api-for-android.html

사람들은 그들이 어디에 있건 만질 수 있다는것 때문에 모바일폰을 선호한다. 그것은 단지 통화뿐이 아니라 이메일, 문자, 마이크로블로깅 등등을 이용할 수 있다는 것을 의미한다. 여기에 search by voice와 voice shortcuts이 추가되었다. Android 2.1에 voice-enabled keyboard로 추가하였으며 이는 연결을 유지하는것도 쉽게 해준다. 이제 당신은 메세지를 타이핑하지 않고 작성가능하다. 그냥 keyboard상의 마이크모양 버튼을 누르기만 하면 된다.

우리는 speech기능이 모바일경험의 근본적인 변화를 일으킬수 있다고 믿는다. 우리는 모든 안드로이드 개발자들을 Android SDK을 이용하여 음성입력기능을 통합하는데 관심을 갖도록 초대하고 싶다. 내가 즐겨 사용하는 음성인식기능어플중에 Handcent SMS을 사용하는데 SMS에 대한 답장을 SMS popup window을 tab함으로써 쉽게 할 수 있다.

Speech input integrated into Handcent SMS

Android SDK는 어플개발시 쉽게 바로 사용할수 있도록 해준다. 그냥 sample application 의 코드를 copy-paste하면 된다. 안드로이드는 오픈플랫폼이기 때문에 당신의 어플은 RecognizerIntent을 수신하는 receiver를 등록하여 임의 어떤 음성인식 어플이든지 만들수 있다. 많은 안드로이드 디바이스에 기본적으로 탑재되어 있는 구글의 Voice Search App는 "Speak now" 팝업을 통해 RecognizerIntent에 응답하며 Google의 서버에 오디오를 전송한다-search widget이나 voice-enabled keyboard상의 마이크 아이콘을 선택했을때에도 이 서버가 이용된다(Settings->Applications->Manage applications에서 Voice Search가 설치되어 있는지 확인가능하다)

중요한 한가지 팀: 음성인식을 가능한 정확하게 하려면, 대화에 어떤 단어가 사용되는지에 대해 아는것이 도움이 된다. email이나 SMS메세지 작성시에는 "Mom, I'm writing you this message with my voice!"같은 유형이 적당할것이며 Google Search에서는 "weather in Mountain View"같이 말하는것이 적당할 것이다. 당신은 사용자가 적절한 language model을 요구하는것으로 최고의 경험을 가능하도록 할 수 있다: "free_form"은 dictation, "web_search"는 더 짧은 검색같은 구문에 적당하다.  우리는 Nexus One의 voice keyboard에서 dictation의 정확도를 향상시키기 위해 "free_form"모델을 개발했다. 반면 "web search"모델은 사용자가 음성으로 검색하고자 할때 사용된다.

Google의 서버는 현재 영어, 만다린(중국), 일본어만 지원한다. Web search 모델은 3가지를 모두 지원하며 free-form모델은 영어에만 최적화되어 있다. 앞으로 더 다양한 언어와 정확도를 개선해 나갈것이며 이를 개발자들이 사용할 수 있게 될것이다.


Posted by 삼스