他们自然会应对文字转WAV音频