但他的描述也足够研究员们参考一番了文字转WAV音频