iconv_open - 分配一个字符集转换的描述符

总览 (SYNOPSIS)

#include <iconv.h>

iconv_t iconv_open (const char* tocode, const char* fromcode);

描述 (DESCRIPTION)

iconv_open 函数分配一个用于把 fromcode 编码的字符串转换成 tocode 编码的转换描述符.

fromcode 和 tocode 所允许的值以及支持的组合方式都是与系统相关的. 对于这个 libiconv 库, 它支持下面的编码, 也支持其所有的组合.

欧洲语言

ASCII, ISO-8859-{1,2,3,4,5,7,9,10,13,14,15,16}, KOI8-R, KOI8-U, KOI8-RU, CP{1250,1251,1252,1253,1254,1257}, CP{850,866}, Mac{Roman,CentralEurope,Iceland,Croatian,Romania}, Mac{Cyrillic,Ukraine,Greek,Turkish}, Macintosh

闪米特语言

ISO-8859-{6,8}, CP{1255,1256}, CP862, Mac{Hebrew,Arabic}

日文

EUC-JP, SHIFT-JIS, CP932, ISO-2022-JP, ISO-2022-JP-2, ISO-2022-JP-1

中文

EUC-CN, HZ, GBK, GB18030, EUC-TW, BIG5, CP950, BIG5-HKSCS, ISO-2022-CN, ISO-2022-CN-EXT

韩文

EUC-KR, CP949, ISO-2022-KR, JOHAB

Armenian

ARMSCII-8

Georgian

Georgian-Academy, Georgian-PS

泰语

TIS-620, CP874, MacThai

捞挝语

MuleLao-1, CP1133

越南语

VISCII, TCVN, CP1258

特定平台

HP-ROMAN8, NEXTSTEP

Full Unicode

UTF-8
UCS-2, UCS-2BE, UCS-2LE
UCS-4, UCS-4BE, UCS-4LE
UTF-16, UTF-16BE, UTF-16LE
UTF-32, UTF-32BE, UTF-32LE
UTF-7
JAVA

用 uint16_t 或 uint32_t 表示的 Unicode

(其字节顺序和对齐方式与具体机器有关) UCS-2-INTERNAL, UCS-4-INTERNAL

用 char 或 wchar_t 表示的与区域设置相关的编码

(其字节顺序和对齐方式与具体机器有关, 其语意与操作系统和当前区域设置中的 LC_CTYPE 有关) char, wchar_t

在 tocode 后面加上 "//TRANSLIT" 表示, 当在目标字符集中不能表示一个字符时, 就用同其相似的一个字符来代替.

其返回的转换描述符可以被 iconv 多次使用. 只要没有用 iconv_close 将其释放, 它就是有效的.

转换描述符包含了转换的状态. 在用 iconv_open 建立一个描述符时状态为初始态. iconv 会改变它的状态. (这说明一个描述符不能在多线程中同时使用.) 可以把 NULL 作为 inbuf 传给 iconv 来使其回到初始态.

posted @ 2019-06-26 08:59 樊伟胜阅读(668) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

樊伟胜

linux命令学习集合

iconv_open - 分配一个字符集转换的描述符

总览 (SYNOPSIS)

描述 (DESCRIPTION)

公告