還以為你要去掉視頻裏的字幕呢。那個要在不破壞圖象的基礎上做,可能挺難的。(我還知道的有限,不是很確定有沒有我不知道的辦法。)
市麵上speech --> voice的東西很多,但voice --> speech的不大好找,估計精度也有問題。如果沒有其他人有更好的辦法來解決這個問題,同時你要是不急的話,我可以聽了記下來,這對我是很好的聽力練習。