因为他至少能堂而皇之地告诉自己文字转WAV音频