Shift_JIS から UTF-8へ
少し前の話になりますが,昨年の秋から,今年の春にかけて,このホームページを運用しているサーバーのOSを更新しました。昨年の暮れまで動いていたOSは CentOS6.4でした。CentOS6はこのサイトを立ち上げた2013年から稼働していたOSです。随分長く利用していましたが,昨年暮れでセキュリティーアップデートが期限切れになるのを機に最新OSに更新することにしました。
当時2020年秋のCentOSの最新版はCentOS8でした。そこで,2020年11月 CentOS8 に更新しました。実はその直後,CentOSのサポートが2021年暮れに終了になることが公表されました。同じOSを長期に使い続けたいとのことから,CentOSでの運用を諦め,CentOS以外のOSを検討しました。検討やテストを行った結果,Oracle Linux を利用することにしました。今年の3月末には Oracle Linux 8.3をインストールし,運用を始めました。現在は Oracle Linux 8.4にアップデートしています。 Oracle Linux 8 は2029年5月まで,サポートされるようなので,長期にわたって利用できそうです。
今回のOSの更新はすべて新規インストールする必要があったので,サーバーを交換するなどの手順が必要になりました。その結果,かなり手間がかかり,約半年間かかりました。その間,旧OSから10年近い期間があったので,ソフトウエアの進歩を色々とかなり感じました。
その中で特に変化を感じたのが,http からhttpsへの移行でした。前回もそのような動きはありましたが,「それも可能」と言ったものでした。今回は,httpsでなければ,まともな運用ができないような状況で,ほぼ強制的にhttps化が迫られました。幸い,https化に必要な認証局登録が無料で可能な方法があったので,それを利用させてもらいました。セキュリティ強化の社会的方向からすれば自然な流れなのでしょう。
もう一つ感じたのが,Unicode化の流れでした。Unicodeは1990年代に始まるもう随分と昔からある流れですが,一般ユーザーが余り意識しないうちに徐々に浸透してきたようです。tbasicも,2010年にUnicode対応になっていますから,tbasicも Unicode化の流れ に乗っていました。しかし今までのtbasic でのUnicode化の実際の恩恵は,半角全角の区別なく,文字列処理が可能となることくらいでした。しかし,現在のUnicode化の流れは,文字コードを積極的にUnicode化するというものです。
サーバー関係の種々のファイルがデフォルトでUTF-8となり,それを標準とする流れです。勿論,UTF-8化の傾向は以前からありました。しかし,今回はさらに進んでサーバー設定のいくつかのところで半ば強制的にUTF-8とさせられた感じがします。Windows上では,現在でもShift_JISが多く使われていますが,UTF-8への流れはWindows上でも確実に進んでいます。実際,Windowの標準エディターであるメモ帳でのデフォルトEncodingがBOM無し,UTF-8になったことが,少し前ですが話題になりました。
他方,近年web等で,日本語の文章の中に,外国語や外国語から派生する用語をよく目にするようになりました。例えば,翻訳サイトでは,日本語と外国語が並列して表示されています。しかし,元々初期のコンピュータではアルファベットと数字しか扱えませんでした。その後,日本では,日本で使用するコンピュータのハード的な改良と,ソフト的な工夫がされ,1980年代には,日本用のコンピュータで日本語,特に漢字が使えるようになりました。
世界的にも同様な状況があり,各国で自国向けのコンピュータの改良が行われ,そのコンピュータで自国向けの自国語文字が使えるようになりました。1991年には,Unicode制定のための非営利国際的組織Unicode Consortium が発足しました。そして,1991年10月にその仕様書”The Unicode Standard Version 1.0″が発表されました。その後更新が続けられ,2021年現在最新版はversion13です。
Unicode を使うと,一つの文書に多国語が混在して使用できるようになります。Shift_JISコードで書かれた日本語の文章にtrès bienと言う言葉を含めることはできませんが,Unicodを使えば混在が可能です。このブログでは,今見ているように,日本語の文書の中にフランス語 très bien を同時に表示できていますが,これは,ブログソフトwordpressがUnicodeの一つであるUTF8でで書かれていることに依ります。
このようにUnicodeが作られてから30年,種々のところで,その利用が顕在化してきました。tbasicも既にUnicode対応ですが,その効用の,より活用を考える時期かも知れません。次期のバージョンアップでは,その辺りの強化を考えてみることにします。