« 2009年2月 | トップページ | 2009年7月 »

2009年3月12日 (木)

ケータイ絵文字がUNICODEに収録されることのWEB制作に与える影響

ついに絵文字がUNICODEに収録されるようですね
http://japan.cnet.com/column/pers/media/story/0,2000058034,20389042,00.htm

めでたいことです。
絵文字がUNICODEに収録された際の自分への影響について考えます。
※WEBプログラマとしての影響と考えてOK

・絵文字が公式規格化されることでPCブラウザで絵文字が表示しやすくなる
   現状IE、firefoxでケータイサイトの確認をする際絵文字を表示するには
   それなりの面倒な設定が必要
・DBに絵文字をそのまま登録することができるようになる。
   現状もMySQLでMS932(Shift_JISの亜流)を指定すれば
   DOCOMO絵文字をそのまま登録できないこともありませんが
   一般的に絵文字はそのままではDBに受け入れられないので
   何らかのエスケープをします。
   これが必要なくなります。
・Javaでネイティブに絵文字を文字として扱える
   現状Eclipseで絵文字が表示できなかったりします。
   これが解消されるのは大きいなぁ
   しかもUNICODEマッピングなのでUNICODEをネイティブ環境としている
   JAVAでネイティブに扱える☆

要するに現状絵文字が扱えないor扱いづらい、様々な環境で
絵文字が使えるようになることが期待できます。
文章にするとそんなこと?と影響が薄いように感じますが、
とてもとても大きな影響があり、感動&期待しております。

はやく収録されないかなぁ…

| | コメント (0) | トラックバック (0)

2009年3月 4日 (水)

JAVA 正規表現ですべての文字にマッチさせるセット

Javaの正規表現には癖がありますねぇ…
Perl癖が何年たっても抜けていないからそう感じるだけかもしれません。

Javaの正規表現でほとんどの文字にマッチしてとても便利な「.(ドット)」
ただこいつはデフォルトでは改行にマッチしてくれません。
Patternクラスを使ってマッチさせる方法もあります「DOTALL」をナンタラカンタラ…

↓詳しくはここ↓
http://www.mlab.im.dendai.ac.jp/~yamada/java/regex/

だがしかし、Patternクラスを使うと言うことで、Patternを使っていない
時この正規表現が使えません
String#replaceAll とかね

でなんか代替えできない物かと考えた結果がこれ
「(.|\\s)」 \s(ソース場では\\s)が改行などの空白文字にうまくマッチしてくれるので
.(ドット)を補完できます。

業務で使ったのですが、汎用的なサンプルが思いつきません(^^;

こんなんでfontタグを削除できるかな?
html_tag = html_tag.replaceAll("<(/)?font((.|\\s)+)?>","");
スイマセン試してないです。

| | コメント (0) | トラックバック (0)

« 2009年2月 | トップページ | 2009年7月 »