使用的是一个日本普通人的躯壳文字转WAV音频