似乎为了确保公平起见文字转WAV音频