郭华给出的推断是完全成立的文字转WAV音频