由此再根据眼前的剑道异象而做出推测文字转WAV音频