語音輸入有2個關鍵,一個是語音識別(Speech Recognition),還有一個是上下文關聯(Context Analysis)。
Nortel當年搞的識別係統(好像是叫Nortel Speech Server吧)如今還是電話AVR語音識別的主要功能塊。
現在的語音輸入係統除了Speech Recognition以外,還有Context Analysis的功能,它能把正確率提高一個數量級。這就是為什麽用語音輸入一段話,一篇文章很順利,錯誤很少,而輸入1個2個Command常會錯誤百出的原因。