恐怕很难两头兼顾文字转WAV音频