而不是依靠外力文字转WAV音频