[Pkg-nlp-ja-devel] kakashi と ティ → tei
NOKUBI Takatsugu
knok @ daionet.gr.jp
2014年 4月 1日 (火) 07:00:26 UTC
手元でいくつか試してみたのですが、特にencodingに依存することはないよ
うです。setlocale等はしていないので、localeによって挙動が変化するという
こともありません。
KAKASIのローマ字変換はテーブルを内部で持っていて、メンテナンス性がよ
ろしくないのが一つの問題だなあ、と以前から思っています。
まずは問題の箇所の特定をしようと思います。ただ、過去にもローマ字変換
テーブルの問題に対応したことがあるのですが、後方互換性のために以前のバー
ジョンと同じ出力をするオプションを追加した経緯があります。今回も同様の
処置が必要になるかもしれません。
At Sun, 30 Mar 2014 22:35:52 +0900,
Osamu Aoki wrote:
>
> KUBI Takatsuguさん、
>
> UTF-8環境でkakasiを使っていて少々動きが変です。
>
> $ echo ティ | kakasi -iutf8 -outf8 -Ka
> tei
>
> 2.3.6にしても同じでした。
>
> これって、「ti」と出力するべきという指摘がありました。
> わたしもそのように思いますがいかがでしょうか?
>
> このほかも含めDebianのバグレポートに3つほど具体的問題が
> 指摘されています。
>
> https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=518178
> https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=207330
> https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=380457
>
> 修正すべき問題なのか、パッチなどコメントあればよろしくお願
> いします。
>
> 青木
>
> PS: 因みに開発環境は何を御使いですか?
>
More information about the Pkg-nlp-ja-devel
mailing list