2008-08-24

pythonで文字列の中に携帯の絵文字が含まれているかどうかを確認する

このエントリーをブックマークに追加 このエントリーを含むはてなブックマーク
pythonで文字列の中に絵文字が含まれるかどうかを確認しようとして以下のような関数を作ってみました。
とりあえず、受け取るフォームはutf-8で作られているとしています。

def include_emoji(str):
'''指定文字列内に絵文字が含まれるかどうかを確認する

  引数
str String チェック対象文字列(utf-8)
  戻り値
Boolean'''
if str is None:
return False
try:
dummy = unicode(str,'utf-8').encode('euc_jp')
except UnicodeEncodeError,UnicodeDecodeError:
return True
return False

本当にこんなんでいいのかどうかよくわからないけど、簡易的に試した限りはうまくいく気配。
でも、本当は携帯の絵文字をキャリア毎に変換することをやりたいと思ったのですが、pythonでのやり方がわからず挫折。
perlやPHPでは変換モジュールみたいのがあるのですが、pythonでは見つからず。。。
作り直すには技術が足らず。。。
コメントを投稿