所以他在说话的时候也没有过于强势文字转WAV音频