声音是自内室里传出来的文字转WAV音频