最终也都不得不选择了放弃文字转WAV音频