所以必须得反反复复的算上好几遍文字转WAV音频