并在两个周域最顶尖存在的引导下文字转WAV音频