这和萧强当初的分析是相符的文字转WAV音频