利用Notepad++转换cue编码格式

下午跟@KimSuQian讨论mp3的乱码问题,进而谈到字符编码问题。一般而言,在另一个地区发售的Win上抓取的CUE表和MP3 tag都有字符编码问题,这种事情在ACG音乐上经常发生。@KimSuQian遇到的问题是他有一些mp3的tag是GBK编码的,但他的Win区域设置是日本,也就是说系统ANSI是JIS编码,播放的时候乱码也就出现了。

要解决这个问题,最妥善的做法是将所有的编码转换为Unicode。为此推荐使用Notepad++来实现,Notepad++是一个优秀而广泛使用的开源文本编辑器,在Win上使用。Notepad++的介绍和下载可以到:

http://notepad-plus-plus.org/

本文的重点并不是讨论ANSI,Unicode和各种编码格式,要了解这些编码标准以及GBK,JIS,UTF-8,UTF-16等等编码格式,可查询Wikipedia或百度百科。另外,关于MP3 tag的一些心得可以见我以前的一篇文章:

http://www.swingworks.net/2009/01/about_mp3_tag/

我们以桌面上的一个JIS编码的CUE文件为例,直接双击播放这个CUE对应的APE文件会导致显示乱码:

cue-01.jpg

右键用Notepad++编辑该文件,可以看到乱码的情况:

cue-02.jpg

这是由于JIS编码的文件在ANSI为GBK的Windows系统上打开造成的(即内地发行的简体中文Windows)。选择格式 >> Character Sets >> Japanese >> SHIFT-JIS,可以看到显示正常了:

cue-03.jpg

目前还不能保存该文件,因为文件只是改换了显示方式,并没有被修改。接下来需要选择格式 >> 转为 UTF-8 编码格式,然后Ctrl+S保存文件:

cue-04.jpg

现在可以关闭文件双击播放了,可以看到Foobar播放显示完全正常了:

cue-05.jpg

UTF-8是Unicode的一种编码格式,在所有支持Unicode的系统上显示应该都是相同的[1]。本文到这里已经可以结束了。但本文的意义在于可以转换各种普通文本的编码格式,例如一个在记事本显示乱码的log文件,该文件也是JIS编码的:

cue-06.jpg

我们可以用上述的步骤转为UTF-8。更进一步的,如果需要转为GBK,可以在上述步骤之后再选择格式 >> 转为 ANSI 编码格式,Ctrl+S保存:

cue-07.jpg

之后用记事本打开,可以发现显示正常了:

cue-08.jpg

当然这样转换后的文件不能再回到JIS系统上打开,否则又是乱码了。因此Unicode是一种极其实用的编码格式,是全球统一编码发展的方向。

[1] UTF-8. Wikipedia. http://en.wikipedia.org/wiki/UTF-8

鱼尾Swing

国内某理工学校电子类专业85后。热爱PS,热爱WEB,对各种技术都好奇。平时看看动画,听听音乐,做爱做的事。作为工坊的工头,负责工坊的维护,操劳各种苦力工作。

More Posts - Website

Follow Me:
Twitter

6 Responses

Leave a Reply