SOFTELメモ Developer's blog

会社概要 ブログ 調査依頼 採用情報 ...
技術者募集中

文字コード一覧(Java)

基本エンコーディング・セット(java.baseモジュールに含まれる)

java.nio API用の正準名java.io APIとjava.lang API用の正準名説明
IBM00858Cp858Cp850の拡張機能でユーロ文字を含む
IBM437Cp437MS-DOS米国、オーストラリア、ニュージーランド、南アフリカ
IBM775Cp775PCバルト諸語
IBM850Cp850MS-DOSラテン文字-1
IBM852Cp852MS-DOSラテン文字-2
IBM855Cp855IBMキリル文字
IBM857Cp857IBMトルコ語
IBM862Cp862PCヘブライ語
IBM866Cp866MS-DOSロシア語
ISO-8859-1ISO8859_1ISO -8859-1、ラテン・アルファベットNo. 1
ISO-8859-2ISO8859_2ラテン・アルファベットNo. 2
ISO-8859-4ISO8859_4ラテン・アルファベットNo. 4
ISO-8859-5ISO8859_5ラテン/キリル文字アルファベット
ISO-8859-7ISO8859_7ラテン/ギリシャ文字アルファベット(ISO-8859-7:2003)
ISO-8859-9ISO8859_9ラテン・アルファベットNo. 5
ISO-8859-13ISO8859_13ラテン・アルファベットNo. 7
ISO-8859-15ISO8859_15ラテン・アルファベットNo. 9
KOI8-RKOI8_RKOI8-R、ロシア語
KOI8-UKOI8_UKOI8-U、ウクライナ語
US-ASCIIASCII米国の情報交換標準コード
UTF-8UTF88ビットUnicode (UCS) Transformation Format
UTF-16UTF-1616ビットUnicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順
UTF-16BEUnicodeBigUnmarked16ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順
UTF-16LEUnicodeLittleUnmarked16ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順
UTF-32UTF_3232ビットUnicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順
UTF-32BEUTF_32BE32ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順
UTF-32LEUTF_32LE32ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順
x-UTF-32BE-BOMUTF_32BE_BOM32ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順、バイト順マーク付き
x-UTF-32LE-BOMUTF_32LE_BOM32ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順、バイト順マーク付き
windows-1250Cp1250Windows東欧
windows-1251Cp1251Windowsキリル文字
windows-1252Cp1252Windowsラテン文字-1
windows-1253Cp1253Windowsギリシャ文字
windows-1254Cp1254Windowsトルコ語
windows-1257Cp1257Windowsバルト諸語
該当なしUnicodeBig16ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順、バイト順マーク付き
x-IBM737Cp737PCギリシャ文字
x-IBM874Cp874IBMタイ
x-UTF-16LE-BOMUnicodeLittle16ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順、バイト順マーク付き

拡張エンコーディング・セット(jdk.charsetsモジュールに含まれる)

java.nio API用の正準名java.io APIとjava.lang API用の正準名説明
Big5Big5Big5、中国語(繁体字)
Big5-HKSCSBig5_HKSCSBig5 (香港の拡張付き)、中国語(繁体字、2001改訂を組み込み)
EUC-JPEUC_JPJISX 0201、0208、0212、EUCエンコーディング、日本語
EUC-KREUC_KRKS C 5601、EUCエンコーディング、韓国語
GB18030GB18030中国語(簡体字)、中華人民共和国標準
GB2312EUC_CNGB2312、EUCエンコーディング、中国語(簡体字)
GBKGBKGBK、中国語(簡体字)
IBM-ThaiCp838IBMタイ拡張SBCS
IBM01140Cp1140Cp037の拡張機能でユーロ文字を含む
IBM01141Cp1141Cp273の拡張機能でユーロ文字を含む
IBM01142Cp1142Cp277の拡張機能でユーロ文字を含む
IBM01143Cp1143Cp278の拡張機能でユーロ文字を含む
IBM01144Cp1144Cp280の拡張機能でユーロ文字を含む
IBM01145Cp1145Cp284の拡張機能でユーロ文字を含む
IBM01146Cp1146Cp285の拡張機能でユーロ文字を含む
IBM01147Cp1147Cp297の拡張機能でユーロ文字を含む
IBM01148Cp1148Cp500の拡張機能でユーロ文字を含む
IBM01149Cp1149Cp871の拡張機能でユーロ文字を含む
IBM037Cp037米国、カナダ(2か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア
IBM1026Cp1026IBMラテン文字-5、トルコ
IBM1047Cp1047ラテン文字-1 (EBCDICホスト用)
IBM273Cp273IBMオーストリア、ドイツ
IBM277Cp277IBMデンマーク、ノルウェー
IBM278Cp278IBMフィンランド、スウェーデン
IBM280Cp280IBMイタリア
IBM284Cp284IBMカタロニア語/スペイン、スペイン語圏ラテン・アメリカ
IBM285Cp285IBM英国、アイルランド
IBM290Cp290EBCDIC-JP-kana、日本語EBCDIC
IBM297Cp297IBMフランス
IBM300Cp300Japan DB EBCDIC、日本語EBCDIC
IBM420Cp420IBMアラビア語
IBM424Cp424IBMヘブライ語
IBM500Cp500EBCDIC 500V1
IBM860Cp860MS-DOSポルトガル語
IBM861Cp861MS-DOSアイスランド語
IBM863Cp863MS-DOSカナダ系フランス語
IBM864Cp864PCアラビア語
IBM865Cp865MS-DOS北欧
IBM868Cp868MS-DOSパキスタン
IBM869Cp869IBM近代ギリシャ語
IBM870Cp870IBM多言語ラテン文字-2
IBM871Cp871IBMアイスランド
IBM918Cp918IBMパキスタン(ウルドゥー語)
ISO-2022-CNISO2022CNISO 2022 CN形式のGB2312およびCNS11643、簡体字および繁体字中国語(Unicodeへの変換のみ)
ISO-2022-JPISO2022JPISO 2022形式のJIS X 0201、0208、日本語
ISO-2022-KRISO2022KRISO 2022 KR、韓国語
ISO-8859-3ISO8859_3ラテン・アルファベットNo. 3
ISO-8859-6ISO8859_6ラテン/アラビア語アルファベット
ISO-8859-8ISO8859_8ラテン/ヘブライ語アルファベット
JIS_X0201JIS_X0201JIS X 0201
JIS_X0212-1990JIS_X0212-1990JIS X 0212
Shift_JISSJISShift-JIS、日本語
TIS-620TIS620TIS620、タイ
windows-1255Cp1255Windowsヘブライ語
windows-1256Cp1256Windowsアラビア語
windows-1258Cp1258Windowsベトナム語
windows-31jMS932Windows日本語
x-Big5-SolarisBig5_SolarisBig5 (Solaris zh_TW.BIG5ロケール用の7つの追加Hanzi表意文字マッピング付き)
x-euc-jp-linuxEUC_JP_LINUXJISX 0201、0208、EUCエンコーディング、日本語
x-EUC-TWEUC_TWCNS11643 (Plane 1-7,15)、EUCエンコーディング、中国語(繁体字)
x-eucJP-OpenEUC_JP_SolarisJISX 0201、0208、0212、EUCエンコーディング、日本語
x-IBM1006Cp1006IBM AIXパキスタン(ウルドゥー語)
x-IBM1025Cp1025IBM多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア(旧ユーゴスラビア・マケドニア共和国)
x-IBM1046Cp1046IBMアラビア語 – Windows
x-IBM1097Cp1097IBMイラン(現代ペルシャ語)/ペルシャ語
x-IBM1098Cp1098IBMイラン(現代ペルシャ語)/ペルシャ語(PC)
x-IBM1112Cp1112IBMラトビア、リトアニア
x-IBM1122Cp1122IBMエストニア
x-IBM1123Cp1123IBMウクライナ
x-IBM1124Cp1124IBM AIXウクライナ
x-IBM1381Cp1381IBM OS/2、DOS中国(中華人民共和国)
x-IBM1383Cp1383IBM AIX中国(中華人民共和国)
x-IBM33722Cp33722IBM-eucJP – 日本語(5050のスーパー・セット)
x-IBM834Cp834IBM EBCDIC DBCS専用韓国語
x-IBM856Cp856IBMヘブライ語
x-IBM875Cp875IBMギリシャ語
x-IBM921Cp921IBMラトビア、リトアニア(AIX、DOS)
x-IBM922Cp922IBMエストニア(AIX、DOS)
x-IBM930Cp930UDC 4370文字を含む日本語カタカナ漢字、5026のスーパー・セット
x-IBM933Cp933UDC 1880文字を含む韓国語、5029のスーパー・セット
x-IBM935Cp935UDC 1880文字を含む簡体字中国語ホスト、5031のスーパー・セット
x-IBM937Cp937UDC 6204文字を含む繁体字中国語ホスト、5033のスーパー・セット
x-IBM939Cp939UDC 4370文字を含む日本語ラテン文字漢字、5035のスーパー・セット
x-IBM942Cp942IBM OS/2日本語、Cp932のスーパー・セット
x-IBM942CCp942CCp942の拡張機能
x-IBM943Cp943IBM OS/2日本語、Cp932およびShift-JISのスーパー・セット
x-IBM943CCp943CCp943の拡張機能
x-IBM948Cp948OS/2中国語(台湾)、938のスーパー・セット
x-IBM949Cp949PC韓国語
x-IBM949CCp949CCp949の拡張機能
x-IBM950Cp950PC中国語(香港、台湾)
x-IBM964Cp964AIX中国語(台湾)
x-IBM970Cp970AIX韓国語
x-ISCII91ISCII91インド語派ISCII91エンコーディング
x-ISO2022-CN-CNSISO2022_CN_CNSISO 2022 CN形式のCNS11643、繁体字中国語(Unicodeからの変換のみ)
x-ISO2022-CN-GBISO2022_CN_GBISO 2022 CN形式のGB2312、簡体字中国語(Unicodeからの変換のみ)
x-iso-8859-11x-iso-8859-11ラテン/タイ語アルファベット
x-JIS0208x-JIS0208JIS X 0208
x-JISAutoDetectJISAutoDetectShift-JIS、EUC-JP、ISO 2022 JPの検出および変換(Unicodeへの変換のみ)
x-Johabx-Johab韓国語、Johab文字セット
x-MacArabicMacArabicMacintoshアラビア語
x-MacCentralEuropeMacCentralEuropeMacintoshラテン文字-2
x-MacCroatianMacCroatianMacintoshクロアチア語
x-MacCyrillicMacCyrillicMacintoshキリル文字
x-MacDingbatMacDingbatMacintosh Dingbat
x-MacGreekMacGreekMacintoshギリシャ語
x-MacHebrewMacHebrewMacintoshヘブライ語
x-MacIcelandMacIcelandMacintoshアイスランド語
x-MacRomanMacRomanMacintosh Roman
x-MacRomaniaMacRomaniaMacintoshルーマニア
x-MacSymbolMacSymbolMacintoshシンボル
x-MacThaiMacThaiMacintoshタイ
x-MacTurkishMacTurkishMacintoshトルコ語
x-MacUkraineMacUkraineMacintoshウクライナ
x-MS950-HKSCSMS950_HKSCSWindows繁体字中国語(香港の拡張付き)
x-mswin-936MS936Windows簡体字中国語
x-PCKPCKSolaris版のShift_JIS
x-SJIS_0213x-SJIS_0213Shift_JISX0213
x-windows-50220Cp50220Windows Codepage 50220 (7ビット実装)
x-windows-50221Cp50221Windows Codepage 50221 (7ビット実装)
x-windows-874MS874Windowsタイ語
x-windows-949MS949Windows韓国語
x-windows-950MS950Windows繁体字中国語
x-windows-iso2022jpx-windows-iso2022jp拡張ISO-2022-JP (MS932ベース)

参考

https://docs.oracle.com/javase/jp/9/intl/supported-encodings.htm

関連するメモ

コメント