所以才会让测试者等半个小时文字转WAV音频