[Pkg-nlp-ja-devel] kakashi と ティ → tei

NOKUBI Takatsugu knok @ daionet.gr.jp
2014年 4月 1日 (火) 07:00:26 UTC


  手元でいくつか試してみたのですが、特にencodingに依存することはないよ
うです。setlocale等はしていないので、localeによって挙動が変化するという
こともありません。

  KAKASIのローマ字変換はテーブルを内部で持っていて、メンテナンス性がよ
ろしくないのが一つの問題だなあ、と以前から思っています。

  まずは問題の箇所の特定をしようと思います。ただ、過去にもローマ字変換
テーブルの問題に対応したことがあるのですが、後方互換性のために以前のバー
ジョンと同じ出力をするオプションを追加した経緯があります。今回も同様の
処置が必要になるかもしれません。

At Sun, 30 Mar 2014 22:35:52 +0900,
Osamu Aoki wrote:
> 
> KUBI Takatsuguさん、
> 
> UTF-8環境でkakasiを使っていて少々動きが変です。
> 
> $ echo ティ | kakasi -iutf8 -outf8 -Ka
> tei
> 
> 2.3.6にしても同じでした。
> 
> これって、「ti」と出力するべきという指摘がありました。
> わたしもそのように思いますがいかがでしょうか?
> 
> このほかも含めDebianのバグレポートに3つほど具体的問題が
> 指摘されています。
> 
> https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=518178
> https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=207330
> https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=380457
> 
> 修正すべき問題なのか、パッチなどコメントあればよろしくお願
> いします。
> 
> 青木
> 
> PS: 因みに開発環境は何を御使いですか?
> 



More information about the Pkg-nlp-ja-devel mailing list