2008年04月28日

正規表現で、文字列は全て全角カタカナか?のチェック(Python編)


UTF-8対応です。


#全て全角カタカナか?
#Pythonの正規表現で、渡された文字列が全てASCII文字かチェックします。(UTF-8向け)
#Python 正規表現 ASCII文字 UTF8
regexp = re.compile(r'^(?:\xE3\x81[\x81-\xBF]|\xE3\x82[\x80-\x93])+$')
result = regexp.search("あいうえおわいうえおん")
if result != None :
print(u"すべてが全角カタカナである".encode('shift_jis'))
else :
print(u"すべてが全角カタカナではない".encode('shift_jis'))


※標準出力をunicode→SJISに変換しているのは、開発環境がWindows+Eclipseの都合です。Windows+Eclipseのコンソールは、SJISエンコーディングオンリーなので。

posted by 台北猫々 at 23:55| Comment(0) | TrackBack(0) | 技術メモ(Python)
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

この記事へのトラックバックURL
http://blog.sakura.ne.jp/tb/14527930

この記事へのトラックバック