他的思路是这个时代的文字转WAV音频