只得在内部累积文字转WAV音频