2009-09-19

pythonで'cp932 codec can't decode bytes in position illegal multibyte sequence'ってエラー

このエントリーをブックマークに追加 このエントリーを含むはてなブックマーク
windows環境でpythonさんをいじっているのですが、
日本語を扱うところで
cp932 codec can't decode bytes in position illegal multibyte sequence
みたいな感じのエラーがでました。

コード的には、

w = "日本語"
ww = "aaa" + w + "bbb"

みたいな感じの2行目の部分で出ました。

とりあえずコードの頭に
# -*- coding: utf-8; -*-
とかつけているからコード内の日本語はutf-8で扱われるのかと思っていたのですが
cp932とか言われてちょっとよくわからず。
でも、

w = u"日本語"
ww = "aaa" + w + "bbb"

とユニコードにしておいたら消えました。

pythonの日本語系の取り扱いは、まだしっくりせずです。
コメントを投稿