ユニコードへ
ユニコードについての説明文書を更新しました。前の版は,2013年10月版ですから,10年ぶりの更新です。https://tbasic.org/reference/202308ToUnicode.pdf
近日中に tbasicをtbasicを1.6にバージョンアップします。その前に,関連する文書として公開することにしました。tbasicでの説明文書の中にユニコードについての用語等が出てきますが,それらを理解する上での基礎知識がまとめてあります。
2013年10月版のタイトルは「ユニコード」です。今回,2023年08月版のタイトルは「ユニコードへ」です。更新内容は,大幅な内容追加です。前の版は7ページでしたが,今回の版は51ページです。改版というより,新たに書いたといった方が良いかもしれません。ただ趣旨は前回と同じで,ユニコードに対する入門的な解説文書です。私自身ユニコードの専門家でないので,私が勉強をして,理解した内容をまとめたものです。私自身への覚書といってもいいかもしれません。
今回,tbasicを1.6にバージョンアップする際に,必要な(主に技術的な)知識を得るために,ユニコード関連の情報を色々読んで得た内容が主ですが,それだけでなく,ユニコードが普及する以前の状況,ユニコードの始まりの状況についても調べてみました。今回はそれらを纏めて,「ユニコードへ」というタイトルにしました。
少し長い文書ですが,ユニコードについての全体的な事柄が,分かるのではと思います。技術的な部分は,プログラミングを念頭に書いているので,その部分は必要な時に読むとして,最初は飛ばして読むのが良いと思います。
全体の内容は,以下の通りです。
目次
- 第I部 ユニコードへ
- 1 ユニコードとは {4頁}
- 2 標準化への動き {4頁}
- 2.1 7ビット符号 {5頁}
- 2.2 8ビット符号 {8頁}
- 2.3 文字集合の切り替え(ISO/IEC 2022)} {11頁}
- 3 日本語環境 {14頁}
- 3.1 符号化文字集合 {14頁}
- 3.2 日本語の文字符号化方式 {19頁}
- 4 ユニコードへ {29頁}
- 4.1 始まり} {29頁}
- 4.2 Unicode Ver.1(1991) {29頁}
- 4.3 Unicode Ver.2(1996) {30頁}
- 4.4 Unicode Ver.3(2000) {31頁}
- 4.5 Unicode Ver.4(2003)とその後 {31頁}
- 4.6 Unicodeの成果 {32頁}
- 第II部 ユニコードの仕組み{33頁}
- 5 ユニコード{33頁}
- 5.1 符号化文字集合 {33頁}
- 5.2 ユニコードの文字符号化方式 {36頁}
- 5.3 Endian {37頁}
- 6 UTFの仕組み {38頁}
- 6.1 UTF-32 {38頁}
- 6.2 UTF-16 {38頁}
- 6.3 UTF-8 {39頁}
- 6.4 BOM {41頁}
- 7 正規化(normalization)}{43頁}
- 7.1 結合文字 {43頁}
- 7.2 等価性 {44頁}
- 7.3 正規化 {45頁}
- 8 フォント{46頁}
- 8.1 フォント {46頁}
- 8.2 日本語用のフォント {47頁}
- 8.3 世界のフォント {49頁}
- 9 まとめ {51頁}