问题是那些注解的小字文字转WAV音频