就是尽量走洼地的低点文字转WAV音频