2008年02月16日

文字コード(エンコーディング)変換

WebサービスのRESTクライアントクラス(C/C++)を作っていて思ったのですが、文字コードが結構困り者ですね。

Yahooの検索サービスAPIの仕様を調査してみると、検索ワードはUTF8エンコーディングすることになっており、レスポンスデータ(XMLデータ)は、こちらは当然といえば当然ですが、UTF8エンコーディングです。

こうなると、UTF8←→SJIS/EUCの相互変換機能が必要な気がしてきました。標準ライブラリやAPIを使って自作するという手もあるのですが、とりあえず、良いライブラリがないかな?と思って探した所、ありました!

IBMが公開しているオープンソースで、"ICU"というなんかすごい数の文字コードの変換をサポートしているライブラリがありました。

http://www.icu-project.org/

しかも、素敵なことにWindows、Linux共にサポートしていますね。
後日にICUの調査レポートを公開しますね。

posted by 台北猫々 at 00:09| Comment(0) | TrackBack(0) | 日記