2008/05/01

PostgreSQLでEUCからUTF8にコード変換できない

Railsのバックエンドで使用している PostgreSQL で、エンコーディングを EUC_JP から UTF8 に変更しようと思い、一度 pg_dump で dumpし てからエンコーディングをUTF8にしたpsqlで importしようとすると
下記のようなエラーが発生して restore できない。

ERROR: character 0xf9f5 of encoding "EUC_JP" has no equivalent in "UTF8"

f9f5 は旧字体の"﨑"という文字でどうやら名詞OCRソフトが自動的に入力してしまったらしい。
他にも以下の文字が UTF8 に変換できなかった。

文字コード 漢字
0xf9f5 﨑
0xfce2 髙 (ハシゴ高)
0xfacb 栁
0xfaf0 濵

0 件のコメント: