根据刚才他听到的那些话文字转WAV音频