取决于怎么去解读文字转WAV音频