大体上和他之前所设想的一样文字转WAV音频