tbasicが1.60になりました。これを機会にそのsamplesとして,いくつかのプログラムを作りました。ここではその中から,binary viewer を紹介します。プログラムの名前は,「Tiny Binary Viewer」で,ファイル名は「tbview.tbt」です。tbasic set 1.60 のsamples\Advancedの中にあります。
1.60では新たに,バイナリファイルの読み書きができる ReadAllBytes,WriteAllBytes関数・手続きをサポートしました。この使い方は,Tiny Basic for Windows ファイル操作編(2023年08月版)10節に書いてあります。簡単に言えば,ファイルの内容をバイト列として,読み書きするものです。 この機能を使えば,原理的には,バイナリエディタを作ることも可能ですが,利用目的が思いつかないので,今回は,binary viewerを作ることにしました。バイナリビューアはすべてのファイルのバイト内容を表示するもので。テキストファイル,画像ファイル,文書ファイル,実行ファイルなど,標準的な起動・開く方法とは異なった形式の表示を得ることができます。そして種々のファイルの舞台裏をつぶさに見ることができます。 今回色々なエンコーディングについて調べるときに,それらの内容の確認をするためには,テキストファイルをバイナリとして確認する必要がありました。そして, ユニコードへ(2023年8月版)を書く際に,実際にtbview.tbtを確認用として使いました。
見ると,ファイル内容は「31 2B 31 82 CC 8C 76 8E 5A」です。この結果は,ユニコードへ(2023年8月版)の23ページでシフトジスでの計算結果に合致します。 同様に,「1+1の計算」と記入したテキストファイルをエンコーディングEUCでファイル名「1足す1EUC.txt」として保存して,この内容をバイナリビューアで表示させると,次のようになります。
見ると,ファイル内容は「31 2B 31 A4 CE B7 D7 BB BB」です。この結果は,ユニコードへ(2023年8月版)の27ページでEUCでの計算結果に合致します。
このプログラムの実行時の注意をあげます。 ・使用中のファイルやフォルダの time stampは変更できません。 ・ファイルですと開いているものなどです。 ・フォルダの time stamp の変更は少し微妙です。 フォルダが使用中と言うことは,そのフォルダ下にあるファイルが使用中ということです。たくさんのファイルやフォルダを含むフォルダの場合,その中にあるファイル等が一つでも使われていると変更できなくなります。
当時2020年秋のCentOSの最新版はCentOS8でした。そこで,2020年11月 CentOS8 に更新しました。実はその直後,CentOSのサポートが2021年暮れに終了になることが公表されました。同じOSを長期に使い続けたいとのことから,CentOSでの運用を諦め,CentOS以外のOSを検討しました。検討やテストを行った結果,Oracle Linux を利用することにしました。今年の3月末には Oracle Linux 8.3をインストールし,運用を始めました。現在は Oracle Linux 8.4にアップデートしています。 Oracle Linux 8 は2029年5月まで,サポートされるようなので,長期にわたって利用できそうです。
他方,近年web等で,日本語の文章の中に,外国語や外国語から派生する用語をよく目にするようになりました。例えば,翻訳サイトでは,日本語と外国語が並列して表示されています。しかし,元々初期のコンピュータではアルファベットと数字しか扱えませんでした。その後,日本では,日本で使用するコンピュータのハード的な改良と,ソフト的な工夫がされ,1980年代には,日本用のコンピュータで日本語,特に漢字が使えるようになりました。 世界的にも同様な状況があり,各国で自国向けのコンピュータの改良が行われ,そのコンピュータで自国向けの自国語文字が使えるようになりました。1991年には,Unicode制定のための非営利国際的組織Unicode Consortium が発足しました。そして,1991年10月にその仕様書”The Unicode Standard Version 1.0″が発表されました。その後更新が続けられ,2021年現在最新版はversion13です。
Unicode を使うと,一つの文書に多国語が混在して使用できるようになります。Shift_JISコードで書かれた日本語の文章にtrès bienと言う言葉を含めることはできませんが,Unicodを使えば混在が可能です。このブログでは,今見ているように,日本語の文書の中にフランス語 très bien を同時に表示できていますが,これは,ブログソフトwordpressがUnicodeの一つであるUTF8でで書かれていることに依ります。