ケータイでドイツ語 2004

ケータイのブラウザは、文字コードの扱いでも進化していた。
前項でもちらっと書いたように、EUC-JP のページが読めるようになっているのだ。手元にあった D503i や Paldio 642S (ともに中身は2001年型)で試してみたら、シフト JIS 以外は文字化けした。2003年の端末である、N505i, J-SH010, AH-J3002V とも、EUC-JP のページは問題なく読めた。UTF-8 は壊滅的に読めないが。
ここに MT をインストールするとき、UTF-8 でなく EUC-JP を選んだのもそのためだ。各国語学習ブログを復習するのに、ケータイで読めた方がいいから。
日本のケータイのブラウザでは、文字実態参照は ü のように表示され、数値参照は N の i-mode 端末のみウムラウトなどが表示される。ただし、パケッ得3などのiアプリでは N であってもほかのケータイと同じ条件になるようだ。
ヨーロッパのケータイは文字実態参照でちゃんとウムラウトが出るらしく、Der Standard(CE版)のように数値参照で書いてくれるところは、あまり多くはなさそうだ。tagesschau (i-mode 版)も、文字実態参照だ。
だから一時期は文字実態参照がナマで出てきてもいいや、と思っていた。ブログは概要などが入るのでファイルが大きくなるけど、それでもいいや、と。でもやっぱり、パケ代は怖いし、ウムラウトも表示したいし、ウムラウトがだめでも u: などで代用して表示してみたい。少なくとも、自分のブログくらいは。
そこで、Naochan のアイデアを借りて、まず MT のテンプレートを作り、ケータイ用の個別&インデックスファイルを出力するようにした。RJ Watch がいちばんわかりやすいかな。
これだけでも十分だったのだけど、同じく Naochan のページにあった conv.cgi を改造して、シフトJIS に変換した上、文字実態参照を「N 端末用の、数値参照」と「ほかの端末用の、u: などで代用したもの」に変換するものを作ってみた。こちらは、CGI を動かさないと更新されないから、もしかしたら古いものが残っているかもしれないけど。
検索は、msearch を利用することにした。これまたインデックスを genindex.cgi で作らないといけないので、MT についている検索よりは、データが古いかもしれない。EUC-JP / 数値参照 / その他 の検索プログラムの表紙は、ケータイ用のページの目次も兼ねている。(ヒソカに、accesskey もつけてある。)
ちなみに conv.cgi の改造場所は、[extra] の部分で、
$line =~ s/&Auml¥;/Ä¥;/g; # A-Umlaut
みたいに書いて並べていけばよい。さらにわたしのシュミで、スタイルシートをそれぞれ入れ替えてみた。x-sjis になるようにメタなんとかタグを書き換えるのも忘れずに。
あともしできたら、外のドイツ語のファイルを数値参照や u: に変換して表示する CGI なんてのが作れるといいんだけど、まだわたしには Perl がよくわからないので、ちょっとお預けかな。何を勉強すればいいのか、調べてみようっと。