并非一定严格按照实力划分文字转WAV音频