目前只是我自己通过观察给出的猜测文字转WAV音频