但还是观察细微的文字转WAV音频