自己则站在箱子前慢慢挑选文字转WAV音频