unicodedata.normalize可以将半角假名转换成全角,将全角字符转换成半角,得到统一的格式:

1import unicodedata
2print unicodedata.normalize("NFKC", u"フガホゲ-%*@ABC−%*@123")