尽管其中三个多小时都在等待文字转WAV音频