1 ansi latin1と同じ (廃止。後方互換性のために残されている)
2 japan 日本語: Unixではeuc-jp、MS-Windowsではcp932
2 korea 韓国語: Unixではeuc-kr、MS-Windowsではcp949
2 prc 簡体中国語: Unixではeuc-cn、MS-Windowsではcp936
2 chinese prcと同じ
2 taiwan 繁体中国語: Unixではeuc-tw、MS-Windowsではcp950
u utf8 utf-8と同じ
u unicode ucs-2と同じ
u ucs2be ucs-2と同じ (ビッグエンディアン)
u ucs-2be ucs-2と同じ (ビッグエンディアン)
u ucs-4be ucs-4と同じ (ビッグエンディアン)
u utf-32 ucs-4と同じ
u utf-32le ucs-4leと同じ
default 'encoding'のデフォルト値を意味する。環境に依存する。
例えば、JIS X 0208に対応する16ドットのフォントは次のように書く:
-misc-fixed-medium-r-normal--16-110-100-100-c-160-jisx0208.1990-0
訳注: For example, in case of a 14 dots font corresponding to JIS X 0208, it is
訳注: written like:
訳注: -misc-fixed-medium-r-normal--16-110-100-100-c-160-jisx0208.1990-0
訳注: 16 dots の typo?
X フォントセット (X FONTSET) *fontset**xfontset*
シングルバイト文字セットは一般的に一つのフォントに関連付けられている。マルチバ
イト文字セットはほとんどの場合、複数のフォントの組合せを使用する。そして表示す
る文字に合ったフォントが選択されて使用される。そのようなフォントの集合をフォン
トセットと呼ぶ。
例: |charset| language "groups of characters"
GB2312 簡体中国語 ISO-8859-1 and GB 2312
Big5 繁体中国語 ISO-8859-1 and Big5
CNS-11643 繁体中国語 ISO-8859-1, CNS 11643-1 and CNS 11643-2
EUC-JP 日本語 JIS X 0201 and JIS X 0208
EUC-KR 韓国語 ISO-8859-1 and KS C 5601 (KS X 1001)
xlsfontsコマンドを使ってフォントを検索できる。例えば、KS C 5601のフォントを探
すには: xlsfonts | grep ksc5601
IMEについて (WHAT IS IME)
IMEは東アジア向けのWindowsの一部で、マルチバイト文字を入力するためのもので
す。 英語などの言語用のWindowsにはIMEは搭載されていない(普通は必要ない)。
しかし、Microsoft Global IMEというものがある。これはInternet Explorer4.0以
上に含まれている。詳しいことは下記のURLを参照。
GLOBAL IMEについて (WHAT IS GLOBAL IME) *global-ime*
Global IMEはWindows 95、Windows 98、Windows NT 4.0のどの言語用のバージョン
でも利用可能で、中国語、日本語、韓国語のテキストをVimに入力することができ
る。
Windows 2000やXpでも問題なく使用できる(ダウンロードは必要ない)。
Windows 2000 ProfessionalにはGlobal IMEが組み込まれており、コントロールパ
ネルの地域と言語のオプション/言語タブ/テキストサービスと入力言語の詳細ボタ
ンから入力言語を追加できる。
Global IMEの詳細は下記のURLを参照。リンク先にはGlobal IMEの各国語用のバー
ジョンもある。
二番目の項目に複数の文字を指定することもできるが、一般的ではない。しか
し、文字を指定するのにいろいろな方法を使用して構わない: A a literal character A <char-97> decimal value A <char-0x61> hexadecimal value A <char-0141> octal value x <Space> special key name
glyph encoding keymap Char utf-8 cp1255 hebrew hebrewp name
?? 0x5d0 0xe0 t a 'alef
?? 0x5d1 0xe1 c b bet
?? 0x5d2 0xe2 d g gimel
?? 0x5d3 0xe3 s d dalet
?? 0x5d4 0xe4 v h he
?? 0x5d5 0xe5 u v vav
?? 0x5d6 0xe6 z z zayin
?? 0x5d7 0xe7 j j het
?? 0x5d8 0xe8 y T tet
?? 0x5d9 0xe9 h y yod
?? 0x5da 0xea l K kaf sofit
?? 0x5db 0xeb f k kaf
?? 0x5dc 0xec k l lamed
?? 0x5dd 0xed o M mem sofit
?? 0x5de 0xee n m mem
?? 0x5df 0xef i N nun sofit
?? 0x5e0 0xf0 b n nun
?? 0x5e1 0xf1 x s samech
?? 0x5e2 0xf2 g u `ayin
?? 0x5e3 0xf3 ; P pe sofit
?? 0x5e4 0xf4 p p pe
?? 0x5e5 0xf5 . X tsadi sofit
?? 0x5e6 0xf6 m x tsadi
?? 0x5e7 0xf7 e q qof
?? 0x5e8 0xf8 r r resh
?? 0x5e9 0xf9 a w shin
?? 0x5ea 0xfa , t tav
Vowel marks and special punctuation:
???? 0x5b0 0xc0 A: A: sheva
???? 0x5b1 0xc1 HE HE hataf segol
???? 0x5b2 0xc2 HA HA hataf patah
???? 0x5b3 0xc3 HO HO hataf qamats
???? 0x5b4 0xc4 I I hiriq
???? 0x5b5 0xc5 AY AY tsere
???? 0x5b6 0xc6 E E segol
???? 0x5b7 0xc7 AA AA patah
???? 0x5b8 0xc8 AO AO qamats
???? 0x5b9 0xc9 O O holam
???? 0x5bb 0xcb U U qubuts
???? 0x5bc 0xcc D D dagesh
???? 0x5bd 0xcd ]T ]T meteg
???? 0x5be 0xce ]Q ]Q maqaf
???? 0x5bf 0xcf ]R ]R rafe
???? 0x5c0 0xd0 ]p ]p paseq
???? 0x5c1 0xd1 SR SR shin-dot
???? 0x5c2 0xd2 SL SL sin-dot
?? 0x5c3 0xd3 ]P ]P sof-pasuq
?? 0x5f0 0xd4 VV VV double-vav
?? 0x5f1 0xd5 VY VY vav-yod
?? 0x5f2 0xd6 YY YY yod-yod
*bom-bytes*
ファイルを読み込むとき、BOM (Byte Order Mark)があれば、そのユニコードエンコー
ディングを判別するのに使われる:
EF BB BF utf-8
FE FF utf-16 big endian
FF FE utf-16 little endian
00 00 FE FF utf-32 big endian
FF FE 00 00 utf-32 little endian