他为什么要选择这个时候出来文字转WAV音频