其实就在说出自己参与选角的要求文字转WAV音频