实际上他们是两国的文字转WAV音频