他无法确定这个假设是否正确文字转WAV音频