文字コード

UTF-8は2度、3度死ぬ(その2)

この記事は、次の記事の続きです。 ブルータスお前もか UTF-8は2度、3度死ぬ(その1) 連邦に下ったのか、その姿は忍びん さて、ようやく文字化けせずに、日本語が表示できる様になりました(?)が、引数で試してませんね。と言うわけで、引き続き頑張りまし…

UTF-8は2度、3度死ぬ(その1)

この記事はブルータスお前もかの続きです。 きっかけは、ふっとしたところから 一晩たってMS932もUTF-8も、なぜか「ファイル構成」と出したつもりが、文字化けして、最初の字が「繝」になっている事に気づく。さて「繝」って何だろう?文字コードを調べてみ…

シフトJISって何バイト?

昨日のwindresの調べごとをしている最中に、同じ質問を見つけた。20年前の私に問えば、怪訝な顔をして2バイトと答えたであろう。しかし、この20年、妙な仕事をしてきた今の私に問えば、2〜4バイト、ただし今は封印されて2バイトじゃない?と答えるだろう。

だめ文字の駄目たる所以

まさにG的(敵?) ソースコードに、だめ文字が入るのならば、\を付与するフィルタを通せば良いではないかと賢い諸兄、諸姉は言うだろう。だが、何処にでも入るのが、だめ文字なのだ。 *.cや*.cppならば、コンパイルする前にフィルタすれば良い。しかし、コンパ…