甚至要上千逐个检查的文字转WAV音频