r17939 - in /branches/upstream/libmime-charset-perl/current: Changes Charset-ja_JP.pod Charset.pm Charset/JA_JP.pod MANIFEST META.yml README

rmayorga-guest at users.alioth.debian.org rmayorga-guest at users.alioth.debian.org
Mon Mar 24 05:33:21 UTC 2008


Author: rmayorga-guest
Date: Mon Mar 24 05:33:16 2008
New Revision: 17939

URL: http://svn.debian.org/wsvn/?sc=1&rev=17939
Log:
[svn-upgrade] Integrating new upstream version, libmime-charset-perl (1.002)

Added:
    branches/upstream/libmime-charset-perl/current/Charset/JA_JP.pod
Removed:
    branches/upstream/libmime-charset-perl/current/Charset-ja_JP.pod
Modified:
    branches/upstream/libmime-charset-perl/current/Changes
    branches/upstream/libmime-charset-perl/current/Charset.pm
    branches/upstream/libmime-charset-perl/current/MANIFEST
    branches/upstream/libmime-charset-perl/current/META.yml
    branches/upstream/libmime-charset-perl/current/README

Modified: branches/upstream/libmime-charset-perl/current/Changes
URL: http://svn.debian.org/wsvn/branches/upstream/libmime-charset-perl/current/Changes?rev=17939&op=diff
==============================================================================
--- branches/upstream/libmime-charset-perl/current/Changes (original)
+++ branches/upstream/libmime-charset-perl/current/Changes Mon Mar 24 05:33:16 2008
@@ -1,3 +1,9 @@
+2008-03-20	Hatuka*nezumi - IKEDA Soji	<hatuka at nezumi.nu>
+	* Release 1.002.
+	* New method undecode().
+	* encoder(): added argument to set instance.
+	* Cleanup PODs.
+
 2008-03-15	Hatuka*nezumi - IKEDA Soji	<hatuka at nezumi.nu>
 
 	* Release 1.001.

Modified: branches/upstream/libmime-charset-perl/current/Charset.pm
URL: http://svn.debian.org/wsvn/branches/upstream/libmime-charset-perl/current/Charset.pm?rev=17939&op=diff
==============================================================================
--- branches/upstream/libmime-charset-perl/current/Charset.pm (original)
+++ branches/upstream/libmime-charset-perl/current/Charset.pm Mon Mar 24 05:33:16 2008
@@ -121,7 +121,7 @@
     }
 }
 
-$VERSION = '1.001';
+$VERSION = '1.002';
 
 ######## Private Attributes ########
 
@@ -375,7 +375,7 @@
 
 =item canonical_charset CHARSET
 
-Get canonical name for charset CHARSET.
+Get canonical name for charset.
 
 =cut
 
@@ -391,23 +391,6 @@
     $self->{InputCharset};
 }
 
-=item $charset->decode(STRING [,CHECK])
-
-Decode STRING to Unicode.
-
-B<Note>:
-When Unicode/multibyte support is disabled (see L<"USE_ENCODE">),
-this function will die.
-
-=cut
-
-sub decode($$$;) {
-    my $self = shift;
-    my $s = shift;
-    my $check = shift || 0;
-    $self->{Decoder}->decode($s, $check);
-}
-
 =item $charset->decoder
 
 Get L<"Encode::Encoding"> object to decode strings by charset.
@@ -419,39 +402,23 @@
     $self->{Decoder};
 }
 
-=item $charset->encode(STRING [,CHECK])
-
-Encode STRING (Unicode or non-Unicode) using compatible charset recommended
-to be used for messages on Internet (if this module know it).
-Note that string will be decoded then encoded even if compatible charset
-was equal to original charset.
-
-B<Note>:
-When Unicode/multibyte support is disabled (see L<"USE_ENCODE">),
-this function will die.
-
-=cut
-
-sub encode($$$;) {
-    my $self = shift;
-    my $s = shift;
-    my $check = shift || 0;
-
-    unless (is_utf8($s) or $s =~ /[^\x00-\xFF]/) {
-	$s = $self->{Decoder}->decode($s, ($check & 0x1)? FB_CROAK(): 0);
-    }
-    $self->{Encoder}->encode($s, $check);
-}
-
-=item $charset->encoder
+=item $charset->encoder([CHARSET])
 
 Get L<"Encode::Encoding"> object to encode Unicode string using compatible
 charset recommended to be used for messages on Internet.
 
 =cut
 
-sub encoder($) {
-    my $self = shift;
+sub encoder($$;) {
+    my $self = shift;
+    my $charset = shift;
+    if ($charset) {
+	$charset = MIME::Charset->new($charset) unless ref $charset;
+	$self->{OutputCharset} = $charset->{InputCharset};
+	$self->{Encoder} = $charset->{Decoder};
+	#XXX$self->{BodyEncoding} = $charset->{BodyEncoding};
+	#XXX$self->{HeaderEncoding} = $charset->{HeaderEncoding};
+    }
     $self->{Encoder};
 }
 
@@ -578,6 +545,47 @@
         $enc = 'BASE64';
     }
     return ($encoded, $cset, $enc);
+}
+
+=item $charset->decode(STRING [,CHECK])
+
+Decode STRING to Unicode.
+
+B<Note>:
+When Unicode/multibyte support is disabled (see L<"USE_ENCODE">),
+this function will die.
+
+=cut
+
+sub decode($$$;) {
+    my $self = shift;
+    my $s = shift;
+    my $check = shift || 0;
+    $self->{Decoder}->decode($s, $check);
+}
+
+=item $charset->encode(STRING [,CHECK])
+
+Encode STRING (Unicode or non-Unicode) using compatible charset recommended
+to be used for messages on Internet (if this module knows it).
+Note that string will be decoded then encoded even if compatible charset
+was equal to original charset.
+
+B<Note>:
+When Unicode/multibyte support is disabled (see L<"USE_ENCODE">),
+this function will die.
+
+=cut
+
+sub encode($$$;) {
+    my $self = shift;
+    my $s = shift;
+    my $check = shift || 0;
+
+    unless (is_utf8($s) or $s =~ /[^\x00-\xFF]/) {
+	$s = $self->{Decoder}->decode($s, ($check & 0x1)? FB_CROAK(): 0);
+    }
+    $self->{Encoder}->encode($s, $check);
 }
 
 =item $charset->encoded_header_len(STRING [, ENCODING])
@@ -839,6 +847,24 @@
     return $DEFAULT_CHARSET;
 }
 
+=item $charset->undecode(STRING [,CHECK])
+
+Encode Unicode string STRING to byte string by input charset of $charset.
+This is a equivalent to C<$charset->decoder->encode()>.
+
+B<Note>:
+When Unicode/multibyte support is disabled (see L<"USE_ENCODE">),
+this function will die.
+
+=cut
+
+sub undecode($$$;) {
+    my $self = shift;
+    my $s = shift;
+    my $check = shift || 0;
+    $self->{Decoder}->encode($s, $check);
+}
+
 =head2 Manipulating Module Defaults
 
 =over 4

Added: branches/upstream/libmime-charset-perl/current/Charset/JA_JP.pod
URL: http://svn.debian.org/wsvn/branches/upstream/libmime-charset-perl/current/Charset/JA_JP.pod?rev=17939&op=file
==============================================================================
--- branches/upstream/libmime-charset-perl/current/Charset/JA_JP.pod (added)
+++ branches/upstream/libmime-charset-perl/current/Charset/JA_JP.pod Mon Mar 24 05:33:16 2008
@@ -1,0 +1,474 @@
+=encoding utf-8
+
+=head1 NAME
+
+MIME::Charset::JA_JP - MIME のためのキャラクタセットæƒ
å ±
+
+=head1 SYNOPSIS
+
+    use MIME::Charset:
+
+    $charset = MIME::Charset->new("euc-jp");
+
+キャラクタセットæƒ
報の取得:
+
+    $benc = $charset->body_encoding; # 例 "Q"
+    $cset = $charset->canonical_charset; # 例 "US-ASCII"
+    $henc = $charset->header_encoding; # 例 "S"
+    $cset = $charset->output_charset; # 例 "ISO-2022-JP"
+
+テキストデータの変換:
+
+    ($text, $charset, $encoding) =
+        $charset->header_encode(
+           "\xc9\xc2\xc5\xaa\xc0\xde\xc3\xef\xc5\xaa".
+           "\xc7\xd1\xca\xaa\xbd\xd0\xce\xcf\xb4\xef");
+    # ...例えば (<converted>, "ISO-2022-JP", "B") を返す
+
+    ($text, $charset, $encoding) =
+        $charset->body_encode(
+            "Collectioneur path\xe9tiquement ".
+    # ...例えば (<original>, "ISO-8859-1", "QUOTED-PRINTABLE") を返す
+
+    $len = $charset->encoded_header_len(
+        "Perl\xe8\xa8\x80\xe8\xaa\x9e", "b"); # 例 28
+
+モジュール既定値の操作:
+
+    use MIME::Charset;
+
+    MIME::Charset::alias("csEUCKR", "euc-kr");
+    MIME::Charset::default("iso-8859-1");
+    MIME::Charset::fallback("us-ascii");
+
+非OOP関数 (近い将来に廃止):
+
+    use MIME::Charset qw(:info);
+
+    $benc = body_encoding("iso-8859-2"); # "Q"
+    $cset = canonical_charset("ANSI X3.4-1968"); # "US-ASCII"
+    $henc = header_encoding("utf-8"); # "S"
+    $cset = output_charset("shift_jis"); # "ISO-2022-JP"
+
+    use MIME::Charset qw(:trans);
+
+    ($text, $charset, $encoding) =
+        header_encode(
+           "\xc9\xc2\xc5\xaa\xc0\xde\xc3\xef\xc5\xaa".
+           "\xc7\xd1\xca\xaa\xbd\xd0\xce\xcf\xb4\xef",
+           "euc-jp");
+    # ...(<変換されたテキスト>, "ISO-2022-JP", "B") を返す。
+
+    ($text, $charset, $encoding) =
+        body_encode(
+            "Collectioneur path\xe9tiquement ".
+            "\xe9clectique de d\xe9chets",
+            "latin1");
+    # ...(<å
ƒã®ãƒ†ã‚­ã‚¹ãƒˆ>, "ISO-8859-1", "QUOTED-PRINTABLE") を返す。
+
+    $len = encoded_header_len(
+        "Perl\xe8\xa8\x80\xe8\xaa\x9e", "b", "utf-8"); # 28
+
+=head1 DESCRIPTION
+
+MIME::Charset は、インターネット上での MIME
+メッセージに用いるキャラクタセットのæƒ
報を提供する。
+
+=head2 定義
+
+B<キャラクタセット> とは、MIME での ``character set'' のことで、
+オクテットの列を文字の列に変換する方法を指す。
+これは、ISO/IEC における ``符号化文字集合'' (CCS) と
+``文字符合化法'' (CES) の両方の概念をåŒ
含する
+(この定義は不正確かもしれません。
+より正確な定義をご存じの方ご指南ください)。
+
+B<エンコーディング> とは、MIME でのそれのことで、
+メッセージ本体やメッセージヘッダ本体を印字可能な
+US-ASCII 文字の列として表現する方法を指す。
+
+=over 4
+
+
+=cut
+
+=head2 コンストラクタ
+
+=item $charset = MIME::Charset->new([CHARSET [, OPTS]])
+
+キャラクタセットオブジェクトを作成して返す。
+
+OPTS には以下の対を指定できる。
+B<NOTE>:
+Unicode/マルチバイト対応が有効になっていないとき (L<"USE_ENCODE"> 参ç
§) は、
+変換を行わないので、以下のオプションは効果を持たない。
+
+=over 4
+
+=item Mapping => MAPTYPE
+
+キャラクタセット名に対して実際に使うマッピングの拡張をするかどうか。
+C<"EXTENDED"> は拡張マッピングを使う。
+C<"STANDARD"> は標準化されている厳密なマッピングを使う。
+既定は C<"EXTENDED">。
+
+=back
+
+=cut
+
+=head2 キャラクタセットæƒ
報の取得
+
+=item $charset->body_encoding
+
+=item body_encoding CHARSET
+
+CHARSET のメッセージ本体で推奨される伝送エンコーディングを取得する。
+
+返値は C<"B"> (BASE64)、C<"Q"> (QUOTED-PRINTABLE)、
+C<undef> (伝送エンコードしなくてよい --- 7BIT か 8BIT)
+のいずれか。これはメッセージヘッダのエンコーディングとは違うこともある。
+
+=cut
+
+=item $charset->as_string
+
+=item canonical_charset CHARSET
+
+キャラクタセットの正規の名前を取得する。
+
+=cut
+
+=item $charset->decoder
+
+キャラクタセットをデコードするのに使う
+L<"Encode::Encoding"> オブジェクトを返す。
+
+=cut
+
+=item $charset->encoder([CHARSET])
+
+インターネット上の MIME
+メッセージで使うことを推奨される互換キャラクタセットでエンコードするのに使う
+L<"Encode::Encoding"> オブジェクトを返す。
+
+=cut
+
+=item $charset->header_encoding
+
+=item header_encoding CHARSET
+
+CHARSET のメッセージヘッダで推奨されるエンコーディング法を取得する。
+
+返値は C<"B">、C<"Q">、C<"S"> (どちらか短くなるほう)、
+C<undef> (エンコードしなくてよい)
+のいずれか。これはメッセージ本体のエンコーディングとは違うこともある。
+
+
+=cut
+
+=item $charset->output_charset
+
+=item output_charset CHARSET
+
+指定した CHARSET と互換で、インターネット上の
+MIME メッセージで使うことを推奨されるキャラクタセット名を
+(当モジュールが知っていれば) 取得する。
+
+Unicode/マルチバイト対応が有効になっていないとき (L<"USE_ENCODE"> 参ç
§) は、
+この関数は単に L<"canonical_charset"> の結果を返す。
+
+
+=cut
+
+=head2 テキストデータの変換
+
+=item $charset->body_encode(STRING [, OPTS])
+
+=item body_encode STRING, CHARSET [, OPTS]
+
+STRING ã‚’ (å¿
要なら) 変換したデータと、
+メッセージ本体で推奨される伝送エンコーディングを取得する。
+CHARSET は STRING を符号化しているキャラクタセット。
+
+OPTS には以下の対を指定できる。
+B<NOTE>:
+Unicode/マルチバイト対応が有効になっていないとき (L<"USE_ENCODE"> 参ç
§) は、
+変換を行わないので、以下のオプションは効果を持たない。
+
+=over 4
+
+=item Replacement => REPLACEMENT
+
+エラー処理法の指定。L<"エラー処理"> 参ç
§ã€‚
+
+=item Detect7bit => YESNO
+
+CHARSET がないとき、7ビットのキャラクタセットを自動認識しようとする。
+既定は C<"YES">。
+
+=back
+
+3要素のリスト (I<変換ずみの文字列>, I<出力のキャラクタセット>,
+I<伝送エンコーディング>) が返る。
+I<伝送エンコーディング> は C<"BASE64">、C<"QUOTED-PRINTABLE">、
+C<"7BIT">、C<"8BIT"> のいずれか。I<出力のキャラクタセット> が決定できず、
+I<変換ずみの文字列> が ASCII以外のバイトを含むときは、
+I<出力のキャラクタセット> は C<undef>、I<伝送エンコーディング> は C<"BASE64">
+となる。
+I<出力のキャラクタセット> が C<"US-ASCII">
+となるのは、文字列が ASCII以外のバイトを含まないときに限る。
+
+
+=cut
+
+=item $charset->decode(STRING [,CHECK])
+
+STRING を Unicode 文字列にデコードする。
+
+B<NOTE>:
+Unicode/マルチバイト対応が有効になっていないとき (L<"USE_ENCODE"> 参ç
§) は、
+この機能を実行すると死ぬ。
+
+=cut
+
+=item $charset->encode(STRING, [, CHECK])
+
+STRING (Unicode 文字列または普通の文字列) を、
+å
ƒã®ã‚­ãƒ£ãƒ©ã‚¯ã‚¿ã‚»ãƒƒãƒˆã¨äº’換でインターネット上の
+MIME メッセージで使うことを推奨されるキャラクタセットを
+(当モジュールが知っていれば) 使って、エンコードする。
+å
ƒã®ã‚­ãƒ£ãƒ©ã‚¯ã‚¿ã‚»ãƒƒãƒˆã¨äº’換キャラクタセットが同じでも、
+文字列をデコードしてからエンコードすることに注意。
+
+B<NOTE>:
+Unicode/マルチバイト対応が有効になっていないとき (L<"USE_ENCODE"> 参ç
§) は、
+この機能を実行すると死ぬ。
+
+=cut
+
+=item $charset->encoded_header_len(STRING [,ENCODING])
+
+=item encoded_header_len STRING, ENCODING, CHARSET
+
+STRING をメッセージヘッダとしてエンコードしたときの長さ
+(行折りはしないとして) を取得する。
+
+ENCODING は C<"B">、C<"Q">、C<"S">
+(C<"B"> と C<"Q"> のうち短くなるほう) のいずれか。
+
+
+=cut
+
+=item $charset->heder_encode(STRING [, OPTS])
+
+=item header_encode STRING, CHARSET [, OPTS]
+
+STRING ã‚’ (å¿
要なら) 変換したデータと、
+メッセージヘッダで推奨されるエンコーディング法を取得する。
+CHARSET は STRING を符号化しているキャラクタセット。
+
+OPTS には以下の対を指定できる。
+B<NOTE>:
+Unicode/マルチバイト対応が有効になっていないとき (L<"USE_ENCODE"> 参ç
§) は、
+変換を行わないので、以下のオプションは効果を持たない。
+
+=over 4
+
+=item Replacement => REPLACEMENT
+
+エラー処理法の指定。L<"エラー処理"> 参ç
§ã€‚
+
+=item Detect7bit => YESNO
+
+CHARSET がないとき、7ビットのキャラクタセットを自動認識しようとする。
+既定は C<"YES">。
+
+=back
+
+3要素のリスト (I<変換ずみの文字列>, I<出力のキャラクタセット>,
+I<エンコーディング法>) が返る。
+I<エンコーディング法> は C<"B">、C<"Q">、C<undef> (エンコードしなくてよい)
+のいずれか。
+I<出力のキャラクタセット> が決定できず、I<変換ずみの文字列>
+が ASCII以外のバイトを含むときは、I<出力のキャラクタセット> は C<"8BIT">
+(これはキャラクタセットの名前ではI<なく>、エンコード不可能なデータを表す特殊値)
+で I<エンコーディング法> は C<undef> (エンコードするべきではない) となる。
+I<出力のキャラクタセット> が C<"US-ASCII">
+となるのは、文字列が ASCII以外のバイトを含まないときに限る。
+
+=back
+
+
+=cut
+
+=item $charset->undecode(STRING [,CHECK])
+
+Unicode 文字列 string を、
+$charset のå
¥åŠ›ã‚­ãƒ£ãƒ©ã‚¯ã‚¿ã‚»ãƒƒãƒˆã‚’使って文字列に変換する。
+これは C<$charset->decoder->encode()> と同等である。
+
+B<NOTE>:
+Unicode/マルチバイト対応が有効になっていないとき (L<"USE_ENCODE"> 参ç
§) は、
+この機能を実行すると死ぬ。
+
+=cut
+
+=head2 モジュール既定値の操作
+
+=over 4
+
+=item alias ALIAS [, CHARSET]
+
+L<"canonical_charset"> で正規名を決定するためのキャラクタセットの別名を取得/設定する。
+
+CHARSET があって偽でないとき、ALIAS が CHARSET の別名に登録される。
+さもなければ、別名に変更はない。いずれの場合でも、
+現在 ALIAS が登録されているキャラクタセットを返す。
+
+
+=cut
+
+=item default [CHARSET]
+
+既定キャラクタセットを取得/設定する。
+
+B<既定キャラクタセット>とは、
+当モジュールで、処理のためのキャラクタセットが不明なときに用いるキャラクタセット。
+当モジュールを利用するモジュールでは、
+処理のためのキャラクタセットが不明なときや暗黙の既定値がå¿
要なとき、
+このキャラクタセットを使うことを推奨する。
+これは既定では C<"US-ASCII">。
+
+CHARSET があって偽でなければ、それを既定キャラクタセットに設定する。
+さもなければ、既定キャラクタセットは変わらない。いずれの場合でも、
+現在の既定キャラクタセットを返す。
+
+B<NOTE>: 既定キャラクタセットは変更するI<べきではない>。
+
+
+=cut
+
+=item fallback [CHARSET]
+
+予備キャラクタセットを取得/設定する。
+
+B<予備キャラクタセット>とは、
+当モジュールで、指定されたキャラクタセットでの変換が失敗し、
+エラー処理法に C<"FALLBACK"> が指定されていたときに用いるキャラクタセット。
+当モジュールを利用するモジュールでは、
+キャラクタセット変換が失敗するときに最終手段としてこのキャラクタセットを使ってもよい。
+これは既定では C<"UTF-8">。
+
+CHARSET があって偽でなければ、それを予備キャラクタセットに設定する。
+CHARSET が C<"NONE"> であれば、予備キャラクタセットを未定にする。
+さもなければ、予備キャラクタセットは変わらない。いずれの場合でも、
+現在の予備キャラクタセットを返す。
+
+B<NOTE>: 予備キャラクタセットに C<"US-ASCII"> を指定する価値はI<ある>。
+変換の結果は、キャラクタセットæƒ
報がないときも可読となる。
+
+
+=cut
+
+=item recommended CHARSET [, HEADERENC, BODYENC [, ENCCHARSET]]
+
+キャラクタセットの特性を取得/設定する。
+
+å¿
須でない引数があってそのどれかが偽でなければ、
+その引数で CHARSET の特性を設定する。さもなければ、特性は変わらない。
+いずれの場合でも、CHARSET の現在の特性を 3 要素のリスト
+(HEADERENC, BODYENC, ENCCHARSET) として返す。
+
+HEADERENC はメッセージヘッダで推奨されるエンコーディング法。
+C<"B">、C<"Q">、C<"S"> (どちらか短くなるほう)、
+C<undef> (エンコードしなくてよい) を指定できる。
+
+BODYENC はメッセージ本体で推奨される伝送エンコーディング。
+C<"B">、C<"Q">、C<undef> (伝送エンコードしなくてよい) を指定できる。
+
+ENCCHARSET は、指定した CHARSET と互換で、インターネット上の
+MIME メッセージで使うことを推奨されるキャラクタセット名。
+変換がå¿
要ない (または当モジュールが適当なキャラクタセットを知らない) ときは、
+ENCCHARSET は C<undef>。
+
+B<NOTE>: この関数の今後の版では、ほかにもå¿
須でない引数をとれるようになるかもしれない
+(たとえば、文字å¹
、行分割の挙動などについての属性)。
+そのため、返値の形式も変わるかもしれない。個ã€
の特性を取得するには
+L<"header_encoding">、L<"body_encoding">、L<"output_charset"> を使ってほしい。
+
+
+=cut
+
+=head2 定数
+
+=item USE_ENCODE
+
+Unicode/マルチバイト対応フラグ。
+Unicode とマルチバイトへの対応が有効になっているときは、空でない文字列が設定されている。
+現在、このフラグは Perl 5.8.1 以降で空でなく、それより以前の Perl では空の文字列。
+
+=head2 エラー処理
+
+L<"body_encode"> と L<"header_encode"> の
+C<Replacement> オプションには以下のものを指定できる:
+
+=item C<"DEFAULT">
+
+不正な文字を置き換え文字で置き換える。
+UCM に基づくエンコーダを持つキャラクタセットでは <subchar> を使う。
+
+=item C<"FALLBACK">
+
+I<予備キャラクタセット> を使って C<"DEFAULT"> 方式をやってみる
+(L<"fallback"> 参ç
§)。
+予備キャラクタセットが未定で変換がエラーを起こしたときは、
+コードはエラーメッセージを出力して死ぬ。
+
+=item C<"CROAK">
+
+コードはエラーメッセージを出力してすぐ死ぬ。
+したがって、本当にエラーで死なせたくなければ
+eval{} で致命的エラーを受け止めなければいけない。
+C<"STRICT"> でも同じ。
+
+=item C<"PERQQ">
+
+=item C<"HTMLCREF">
+
+=item C<"XMLCREF">
+
+L<Encode> モジュールで定義している
+C<FB_PERLQQ>、C<FB_HTMLCREF>、C<FB_XMLCREF>
+の方式を使う。
+
+=back
+
+エラー処理法が指定されないか、上記以外のエラー処理法が指定されたときは、
+C<"DEFAULT"> とみなす。
+
+=head2 設定ファイル
+
+オプションのパラメタの組み込み既定値は、設定ファイル
+F<MIME/Charset/Defaults.pm> で変更することができる。
+詳しくは F<MIME/Charset/Defaults.pm.sample> を読んでほしい。
+
+=head1 VERSION
+
+$VERSION 変数を見てほしい。
+
+このモジュールの開発版が
+L<http://hatuka.nezumi.nu/repos/MIME-Charset/> にある。
+
+=head1 SEE ALSO
+
+Multipurpose Internet Mail Extensions (MIME).
+
+=head1 AUTHORS
+
+Copyright (C) 2006-2008 Hatuka*nezumi - IKEDA Soji <hatuka(at)nezumi.nu>.
+
+All rights reserved.  This program is free software; you can redistribute
+it and/or modify it under the same terms as Perl itself.
+
+
+=cut

Modified: branches/upstream/libmime-charset-perl/current/MANIFEST
URL: http://svn.debian.org/wsvn/branches/upstream/libmime-charset-perl/current/MANIFEST?rev=17939&op=diff
==============================================================================
--- branches/upstream/libmime-charset-perl/current/MANIFEST (original)
+++ branches/upstream/libmime-charset-perl/current/MANIFEST Mon Mar 24 05:33:16 2008
@@ -1,9 +1,9 @@
 ARTISTIC
 Changes
 Charset.pm
-Charset-ja_JP.pod
 Charset/_Compat.pm
 Charset/Defaults.pm.sample
+Charset/JA_JP.pod
 GPL
 Makefile.PL
 MANIFEST			This list of files

Modified: branches/upstream/libmime-charset-perl/current/META.yml
URL: http://svn.debian.org/wsvn/branches/upstream/libmime-charset-perl/current/META.yml?rev=17939&op=diff
==============================================================================
--- branches/upstream/libmime-charset-perl/current/META.yml (original)
+++ branches/upstream/libmime-charset-perl/current/META.yml Mon Mar 24 05:33:16 2008
@@ -1,7 +1,7 @@
 # http://module-build.sourceforge.net/META-spec.html
 #XXXXXXX This is a prototype!!!  It will change in the future!!! XXXXX#
 name:         MIME-Charset
-version:      1.001
+version:      1.002
 version_from: Charset.pm
 installdirs:  site
 requires:

Modified: branches/upstream/libmime-charset-perl/current/README
URL: http://svn.debian.org/wsvn/branches/upstream/libmime-charset-perl/current/README?rev=17939&op=diff
==============================================================================
--- branches/upstream/libmime-charset-perl/current/README (original)
+++ branches/upstream/libmime-charset-perl/current/README Mon Mar 24 05:33:16 2008
@@ -70,7 +70,7 @@
     MIME::Charset provides informations about character sets used for MIME
     messages on Internet.
 
-  DEFINITIONS
+  Definitions
     The charset is ``character set'' used in MIME to refer to a method of
     converting a sequence of octets into a sequence of characters. It
     includes both concepts of ``coded character set'' (CCS) and ``character
@@ -80,11 +80,20 @@
     body part or a header body as sequence(s) of printable US-ASCII
     characters.
 
-  CONSTRUCTOR
-    $charset = MIME::Charset->new(CHARSET)
-        Create charset object from CHARSET.
-
-  GETTING INFORMATIONS OF CHARSETS
+  Constructor
+    $charset = MIME::Charset->new([CHARSET [, OPTS]])
+        Create charset object.
+
+        OPTS may accept following key-value pairs. NOTE: When
+        Unicode/multibyte support is disabled (see "USE_ENCODE"), conversion
+        will not be performed. So these options do not have any effects.
+
+        Mapping => MAPTYPE
+            Specify extended mappings actually used for charset names.
+            "EXTENDED" uses extended mappings. "STANDARD" uses standardized
+            strict mappings. Default is "EXTENDED".
+
+  Getting Informations of Charsets
     $charset->body_encoding
     body_encoding CHARSET
         Get recommended transfer-encoding of CHARSET for message body.
@@ -93,9 +102,16 @@
         or "undef" (might not be transfer-encoded; either 7BIT or 8BIT).
         This may not be same as encoding for message header.
 
-    $charset->canonical_charset
+    $charset->as_string
     canonical_charset CHARSET
-        Get canonical name for charset CHARSET.
+        Get canonical name for charset.
+
+    $charset->decoder
+        Get "Encode::Encoding" object to decode strings by charset.
+
+    $charset->encoder([CHARSET])
+        Get "Encode::Encoding" object to encode Unicode string using
+        compatible charset recommended to be used for messages on Internet.
 
     $charset->header_encoding
     header_encoding CHARSET
@@ -114,7 +130,7 @@
         When Unicode/multibyte support is disabled (see "USE_ENCODE"), this
         function will simply return the result of "canonical_charset".
 
-  TRANSLATING TEXT DATA
+  Translating Text Data
     $charset->body_encode(STRING [, OPTS])
     body_encode STRING, CHARSET [, OPTS]
         Get converted (if needed) data of STRING and recommended
@@ -140,6 +156,21 @@
         *transfer-encoding* will be "BASE64". *Charset for output* will be
         "US-ASCII" if and only if string does not contain any non-ASCII
         bytes.
+
+    $charset->decode(STRING [,CHECK])
+        Decode STRING to Unicode.
+
+        Note: When Unicode/multibyte support is disabled (see "USE_ENCODE"),
+        this function will die.
+
+    $charset->encode(STRING [,CHECK])
+        Encode STRING (Unicode or non-Unicode) using compatible charset
+        recommended to be used for messages on Internet (if this module
+        knows it). Note that string will be decoded then encoded even if
+        compatible charset was equal to original charset.
+
+        Note: When Unicode/multibyte support is disabled (see "USE_ENCODE"),
+        this function will die.
 
     $charset->encoded_header_len(STRING [, ENCODING])
     encoded_header_len STRING, ENCODING, CHARSET
@@ -175,7 +206,14 @@
         be "US-ASCII" if and only if string does not contain any non-ASCII
         bytes.
 
-  MANIPULATING MODULE DEFAULTS
+    $charset->undecode(STRING [,CHECK])
+    Encode Unicode string STRING to byte string by input charset of
+    $charset. This is a equivalent to "$charset-"decoder->encode()>.
+
+    Note: When Unicode/multibyte support is disabled (see "USE_ENCODE"),
+    this function will die.
+
+  Manipulating Module Defaults
     alias ALIAS [, CHARSET]
         Get/set charset alias for canonical names determined by
         "canonical_charset".
@@ -242,14 +280,14 @@
         changed. Use "header_encoding", "body_encoding" or "output_charset"
         to get particular profile.
 
-  CONSTANTS
+  Constants
     USE_ENCODE
-        Unicode/multibyte support flag. Non-null string will be set when
+        Unicode/multibyte support flag. Non-empty string will be set when
         Unicode and multibyte support is enabled. Currently, this flag will
-        be non-null on Perl 5.8.1 or later and null string on earlier
+        be non-empty on Perl 5.8.1 or later and empty string on earlier
         versions of Perl.
 
-  ERROR HANDLING
+  Error Handling
         "body_encode" and "header_encode" accept following "Replacement"
         options:
 
@@ -276,6 +314,11 @@
     If error handling scheme is not specified or unknown scheme is
     specified, "DEFAULT" will be assumed.
 
+  Configuration File
+    Built-in defaults for option parameters can be overridden by
+    configuration file: MIME/Charset/Defaults.pm. For more details read
+    MIME/Charset/Defaults.pm.sample.
+
 VERSION
     Consult $VERSION variable.
 




More information about the Pkg-perl-cvs-commits mailing list