后面几乎是用喊的文字转WAV音频