ISO-10646-UCS-4 |
ISO 10646 |
31λ����ռ��ͨ���ַ������� ISO/IEC 10646 ����Ϊ UCS-4��
�������µ� Unicode ����ӳ�����ͬ����
|
����ڱ���ת��������ʹ����������֣�ת����������ʶ��ǰ�� BOMͷ���ֽ�˳���ǣ�������ʾ�����ֽڵ��ֽ���
|
ISO-10646-UCS-4 |
UCS-4 |
�μ����ϡ�
|
�� UCS-4 ��Ƚϣ��ַ���������Ϊ�����big endian������ʽ��
|
ISO-10646-UCS-4 |
UCS-4 |
�μ����ϡ�
|
�� UCS-4 ��Ƚϣ��ַ���������ΪС����little endian������ʽ��
|
ISO-10646-UCS-2 |
UCS-2 |
16λ����ռ��ͨ���ַ������� ISO/IEC 10646 ����Ϊ UCS-2���������µ� Unicode ����ӳ�����ͬ����
|
����ڱ���ת��������ʹ����������֣�ת����������ʶ��ǰ�� BOMͷ���ֽ�˳���ǣ�������ʾ�����ֽڵ��ֽ���
|
ISO-10646-UCS-2 |
UCS-2 |
�μ����ϡ�
|
�� UCS-2 ��Ƚϣ��ַ���������Ϊ�����big endian������ʽ��
|
ISO-10646-UCS-2 |
UCS-2 |
�μ����ϡ�
|
�� UCS-2 ��Ƚϣ��ַ���������ΪС����little endian������ʽ��
|
UTF-32 |
Unicode |
32 λ��λ��ȵ� Unicode ת����ʽ���漰���� Unicode �ַ��������ñ��뷽���� UCS-4 û����ȫ��ͬ����Ϊ Unicode ����ռ�����Ϊ 21 λ��ֵ��
|
����ڱ���ת��������ʹ����������֣�ת����������ʶ��ǰ�� BOMͷ���ֽ�˳���ǣ�������ʾ�����ֽڵ��ֽ���
|
UTF-32BE |
Unicode |
����� |
�� UTF-32 ��Ƚϣ��ַ���������Ϊ�����big endian������ʽ��
|
UTF-32LE |
Unicode |
����� |
�� UTF-32 ��Ƚϣ��ַ���������ΪС����little endian������ʽ��
|
UTF-16 |
Unicode |
16 λ��λ��ȵ� Unicode ת����ʽ��ֵ��һ�ǵ��ǣ�UTF-16 �Ĺ���ٺ� UCS-2 һ����
��Ϊ Unicode 2.0 �����˴�����ƣ�surrogate mechanism����UTF-16 ����ָ���� 21 λ�ı���ռ䡣
|
����ڱ���ת��������ʹ����������֣�ת����������ʶ��ǰ�� BOMͷ���ֽ�˳���ǣ�������ʾ�����ֽڵ��ֽ���
|
UTF-16BE |
Unicode |
�μ����ϡ�
|
�� UTF-16 ��Ƚϣ��ַ���������Ϊ�����big endian������ʽ��
|
UTF-16LE |
Unicode |
�μ����ϡ�
|
�� UTF-16 ��Ƚϣ��ַ���������ΪС����little endian������ʽ��
|
UTF-8 |
Unicode / UCS |
8 λ��λ��ȵ� Unicode ת����ʽ��
|
none |
UTF-7 |
Unicode |
һ���ʼ���ȫ�� Unicode ת����ʽ������� » RFC2152��
|
none |
(none) |
Unicode |
UTF-7 ��һ�ֱ��壬������ » IMAP Э�� ���õ��ˡ�
|
none |
US-ASCII (��ѡ MIME ����) / iso-ir-6 / ANSI_X3.4-1986 /
ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
|
ASCII / ISO 646 |
���������루American Standard Code����һ�ֳ��õ� 7-bit ��Ϣ�������롣ͬ��������Ϊ ISO 646 ���ʱ���
|
(none) |
EUC-JP (��ѡ MIME ����) /
Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
|
US-ASCII / JIS X0201:1997 (��Ǽ�������) /
JIS X0208:1990 / JIS X0212:1990 �ĸ���
|
�������������ģ�������Դ����չ Extended UNIX Code Packed Format for Japanese ����д���ñ��볣���� UNIX ������ƽ̨��ԭʼ���뷽�� Extended UNIX Code ���� ISO 2022 ����ơ�
|
EUC-JP �漰���ַ����� IBM932 / CP932 �Dz�һ���ģ�����ʹ���� OS/2® �� Microsoft® Windows®��
��Щƽ̨�ϵ���Ϣ������ʹ�� EUCJP-WIN �����档
|
Shift_JIS (��ѡ MIME ����) / MS_Kanji / csShift_JIS |
JIS X0201:1997 / JIS X0208:1997 �ĸ��� |
80 ������������������ִ�������������г�֮ʱ��Ϊ�˼��ݴ�ͳ���뷽�� JIS X 0201:1976�������� Shift_JIS��
���� IANA �� Shift_JIS ���뼯�Ķ��壬�� IBM932 / CP932 ���в�ͬ���� "SJIS"��"Shift_JIS" �����Ƴ��������ָ����Щ���뼯��
|
Ҫʹ�� CP932��ʹ�� SJIS-WIN ��Ϊ����� |
(none) |
JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions �ĸ���
|
��Ȼ�� "encoding" ʹ���� EUC-JP ͬ���ķ�����һЩ�ַ���������ͬ��
Ҳ����˵��һЩ����ӳ�䵽�˺� EUC-JP ��ͬ���ַ���
|
none |
Windows-31J / csWindows31J |
JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions �ķ���
|
��Ȼ�� "encoding" ʹ���� Shift_JIS ͬ���ķ�����һЩ�ַ���������ͬ��
Ҳ����˵��һЩ����ӳ�䵽�˺� Shift_JIS ��ͬ���ַ���
|
(none) |
ISO-2022-JP (��ѡ MIME ����) / csISO2022JP |
US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
|
» RFC1468 |
(none) |
JIS |
|
|
|
ISO-8859-1 |
|
|
|
ISO-8859-2 |
|
|
|
ISO-8859-3 |
|
|
|
ISO-8859-4 |
|
|
|
ISO-8859-5 |
|
|
|
ISO-8859-6 |
|
|
|
ISO-8859-7 |
|
|
|
ISO-8859-8 |
|
|
|
ISO-8859-9 |
|
|
|
ISO-8859-10 |
|
|
|
ISO-8859-13 |
|
|
|
ISO-8859-14 |
|
|
|
ISO-8859-15 |
|
|
|
ISO-8859-16 |
|
|
|
byte2be |
|
|
|
byte2le |
|
|
|
byte4be |
|
|
|
byte4le |
|
|
|
BASE64 |
|
|
|
HTML-ENTITIES |
|
|
|
7bit |
|
|
|
8bit |
|
|
|
EUC-CN |
|
|
|
CP936 |
|
|
|
HZ |
|
|
|
EUC-TW |
|
|
|
CP950 |
|
|
|
BIG-5 |
|
|
|
EUC-KR |
|
|
|
UHC (CP949) |
|
|
|
ISO-2022-KR |
|
|
|
Windows-1251 (CP1251) |
|
|
|
Windows-1252 (CP1252) |
|
|
|
CP866 (IBM866) |
|
|
|
KOI8-R |
|
|
|
KOI8-U |
|
|
|