由于历史原因,国际化的文字常常由于语言或者国家的原因使用不同的编码。
历史简介
随着互联网时代的到来,通过互联网进行文字交流也逐渐增多:浏览外国的网站,这个时候字符编码的转换变得尤为重要。这带来了一个问题,就是许多字符在某一种编码方式中没有。为了解决这种混乱,Unicode的编码方式被建立。Unicode是一种超级编码包含了所有这些编码的字符集,因此一些新的文本格式像XML的默认编码方式就是Unicode。
但是很多老式的计算机还在使用当地的传统的字符编码方式。而一些程序,例如邮件程序和浏览器必须能在这些不同的用户编码之间作转换。其他的一些程序则内置支持Unicode,以顺利支持国际化的处理,但是仍然有在Unicode和其他的传统编码之间转换的需求。GNU的libiconv就是为这两种应用设计的编码转换库。
编码简介
libiconv库为需要做转换的应用提供了一个iconv()的函数,以实现一个字符编码到另一个字符编码的转换。
包括的编码有:
欧洲语系ASCII,ISO8859{1,2,3,4,5,7,9,10,13,14,15,16},KOI8R,KOI8U,KOI8RU,CP{1250,1251,1252,1253,1254,1257},CP{850,866},Mac{Roman,CentralEurope,Iceland,Croatian,Romania},Mac{Cyrillic,Ukraine,Greek,Turkish},Macintosh犹太语系ISO8859{6,8},CP{1255,1256},CP862,Mac{Hebrew,Arabic}日文EUCJP,SHIFTJIS,CP932,ISO2022JP,ISO2022JP2,ISO2022JP1中文EUCCN,...
(全文)