質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Perl

Perlは多目的に使用される実用性が高い動的プログラミング言語のひとつです。

Q&A

解決済

3回答

8533閲覧

jcode.plを使用しているソースを移植したいが古いのでJcode.pmにしたいが踏ん切りが付かない

ma2hiro

総合スコア159

Perl

Perlは多目的に使用される実用性が高い動的プログラミング言語のひとつです。

0グッド

2クリップ

投稿2020/08/12 06:24

お世話になっております。

今現在
WindowsServer2008R2Stdで動いていたPerlのシステムを

C:\download\ma2test>perl -version This is perl, v5.6.1 built for MSWin32-x86-multi-thread (with 1 registered patch, see perl -V for more detail)

をWindowsServer2019Stdに移植しようとしております。

D:\download>perl -version This is perl 5, version 28, subversion 1 (v5.28.1) built for MSWin32-x64-multi-thread (with 1 registered patch, see perl -V for more detail)

そのままだと
使用しているjcode.pl内で

Can't use 'defined(%hash)' (Maybe you should just omit the defined()?) at ./jcode.pl line 537.

となどと出るので下記のようにちまちま変更しています……
【jcode.pl】

sub z2h_euc { local(*_, $n) = @_; # &init_z2h_euc unless defined %z2h_euc; &init_z2h_euc unless %z2h_euc; s/$re_euc_c|$re_euc_kana/$z2h_euc{$&} ? ($n++, $z2h_euc{$&}) : $&/geo; $n; }

変更していくうちにこのままjcode.plを使い続けるより
Jcode.pmにした方が良い気がしたのでお伺いいたします。

使っている部分は

pl

1 $v="$_"; 2 &jcode'convert(*v,'sjis');

とconvertしか使っていないのです。

イ)jcode.plでエラーが出そうな部分を修正して使い続ける
ロ)思い切ってJcode.pmを使うようにソースを変更する。

上記どちらが良いと判断付かないので相談に乗って頂けないでしょうか?

ちなみにjcode.plの最新版を入れて動作するか確認したのですが駄目でした。

&jcode'convert(*v,'sjis'); ぐらいしか使っていないのですが
イ)jcode.plでエラーが出そうな部分を修正して使い続ける
ロ)思い切ってJcode.pmを使うようにソースを変更する。
上記イロどちらが良いでしょうか?

以上お問い合わせいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ベストアンサー

jcode.pmに乗り換えたいということですが、お勧めしません。

jcode.pmもperl 5.8がリリースされた時点で時代遅れになった代物です。もう優に10年以上前です。そもそも現在主流であるutf-8に対応していません。今は、Encode.pmというものを使います。jcodeよりもすっきりした形で多国語言語処理が出来ます。

現代的なperlでの日本処理については幾つか回答していますので、参考にしてください。
https://teratail.com/questions/127212

投稿2020/08/12 06:32

編集2020/08/12 06:39
KojiDoi

総合スコア13692

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ma2hiro

2020/08/12 07:03

KojiDoiさん コメントありがとうございます。 Encode.pmがおすすめなのですね。 こちらを使用出来るように修正します。 コメントありがとうございました。
guest

0

Encode.pmは標準モジュールなので最初から入ってます。

投稿2020/08/12 07:35

KojiDoi

総合スコア13692

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ma2hiro

2020/08/12 07:53

ありがとうございます。 初めから入っているのですね。 ``` use strict; use warnings; use Encode; my $string= "あうあうあ"; # perl内部文字コードにデコードして $string = decode( "UTF-8", $string ); print "Content-type: text/html \n\n"; print '<html><font size="+2" color="#ff0000"><center>'; #print encode( "cp932", $string );#コマンドプロンプト上の文字コード #print encode( 'UTF-8', $string );#UTF-8 print encode( 'Shift_jis', $string ); print '</center></font></html>'; ``` が化けてしまうのですが $string = decode( "UTF-8", $string ); で内部にUTF8で保存 print encode( 'Shift_jis', $string );   でSJISで出力ではないのでしょうか??? Encode.pm使い慣れていなくて申し訳無いのですが上記お問い合わせいたします。
KojiDoi

2020/08/12 09:32

まず、スクリプト冒頭に ``` use utf8; binmode STDOUT, ':encoding(cp932)'; ``` を追加してください。 1行目で、 "あうあうあ";が自動的に内部文字列化されるようになります。 2行目で、標準出力がshiftJISになります。「cp932」はShiftJISにMicrosoft独自拡張が加わった文字コードです。 これで各行にいちいちdecode関数やencode関数を噛ませる必要はなくなります。
ma2hiro

2020/08/13 00:25

KojiDoiさん コメントありがとうございます。 test.pl[SJIS CR+LF] ``` use utf8; binmode STDOUT, ':encoding(cp932)'; BEGIN{ open ( STDERR, ">>./log/err_log/err.txt" ); } use strict; use warnings; use Encode; my $string= "あうあうあ"; # perl内部文字コードにデコードして $string = decode( "UTF-8", $string ); print "Content-type: text/html \n\n"; print '<html><font size="+2" color="#ff0000"><center>'; print encode( 'Shift_jis', $string );#UTF-8 print '</center></font></html>'; ``` にてエラーメッセージが ``` Malformed UTF-8 character: \x82 (unexpected continuation byte 0x82, with no preceding start byte) at D:\download\test.pl line 14. Malformed UTF-8 character (fatal) at D:\download\test.pl line 14. ``` でしたがもう少し見てみます…… use utf8; を色んな所においてみたのですが 駄目なのかな…… perl v5.28.1には標準で入っていない気がしてきました……
KojiDoi

2020/08/13 04:24

スクリプトはUTF-8でセーブしてください。 use utf8したら文字列定数は最初からデコードされた状態(内部コード化された状態)なので、これをさらにdecode( "UTF-8", $string )してはいけません。 binmode STDOUT, ':encoding(cp932)'; することで、STDOUTへの出力はそのつど自動的にencodeされます。勝手に自分でencode( 'Shift_jis', $string )してはいけません。 対象文字列がデコードされているのかいないのかを常に意識しながらコードを書いてみてください。基本的に、decode/encodeをじかに使う必要はありません。これらは行儀の悪いライブラリから原則に外れたデータを受け取らなければいけない場合などに例外的に使うものと思ってください。
ma2hiro

2020/08/13 05:00

KojiDoiさん 仰る通りスクリプトをUTF8で保存したらうまく use utf8; が働いて動作しました。 ありがとうございます。 今現在Encode.pmを用いて $code = &jcode'getcode(*v);             ^^^^^^^^^ を実装する方法探し中ですが ググっても見つけられなかったので どういう語句でググると良いかご助力頂けますと嬉しく思います。 本当にお手数おかけして申し訳無いです……
KojiDoi

2020/08/13 05:32

文字コード判定はEncode::Guessで対応します。
ma2hiro

2020/08/13 05:45

KojiDoiさん ありがとうございます。 ``` use utf8; binmode STDOUT, ':encoding(cp932)'; BEGIN{ open ( STDERR, ">>./log/err_log/err.txt" ); } use strict; use warnings; use Encode; my $string= "あうあうあ"; print "Content-type: text/html \n\n"; print '<html><font size="+2" color="#ff0000"><center>'; print $string; my $code = Encode::Guess($string); print "mojicode $code"; print '</center></font></html>'; ``` でerr.txtに Undefined subroutine &Encode::Guess called at D:\download\test.pl line 28. と表示され Encode::Guess で落ちているようなのですが使用方法は違うのでしょうか? https://allabout.co.jp/gm/gc/455808/ のように use Encode::Guess qw/cp932 euc-jp 7bit-jis utf8/; #文字コードの候補を指定して use する とやらないといけないのかどうか使用方法を調査中ですが上記お問い合わせいたします。 本当に申し訳ございません。
KojiDoi

2020/08/13 06:28

> やらないといけないのか やらないといけません。 「JISコード」や「EUCコード」のテキストは登場し得ないという確信があるならeuc-jp 7bit-jis は抜いて結構です。コード体系の候補が少ないほど、判断の確実性は増します。
ma2hiro

2020/08/13 06:34

KojiDoiさん ありがとうございます。 多分・Linuxサーバー上のファイル名と・テキストファイル内の文字コードを判別している のだと思うので抜かずに実装してみます。 本当にありがとうございました。
guest

0

KojiDoiさんより
Encode.pmを用いるべしとの事で
https://metacpan.org/source/DANKOGAI/Encode-3.07/Encode.pm
からダウンロードして使えるように操作中メモ失礼します。

投稿2020/08/12 07:33

編集2020/08/12 07:34
ma2hiro

総合スコア159

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ma2hiro

2020/08/13 05:54

なんか上のKojiDoiさんにいっぱいコメントして申し訳無いので コチラに表記します。 http://www.ksknet.net/perl/encodeguess.html には Encode::Guess->guess($string); と使用すると表記あり use Encode::Guess qw/shift-jis euc-jp 7bit-jis/; を付けて my $code = Encode::Guess->guess($string); とすれば$code内に入るようだ…… 今現在 $code = &jcode'getcode(*v); をEncode.pmに移植したいので そちらの方法を調べていて 多分Encode.pmを使用した方法は       $code = Encode::Guess->guess(*v); だと思われる。 こちらで実装してみる。
ma2hiro

2020/08/13 06:28

で その後 print "mojicode $code"; とすると mojicode Encode::utf8=HASH(0x1912480) と表示されるのだけど utf8だけに出来ないのかな???
ma2hiro

2020/08/13 06:46

my $code = Encode::Guess->guess($string); my $genc = guess_encoding($string); my $gencName =$genc->name; print "mojicode $code<br>mojicode2 $gencName"; だと$gencNameがutf8だったのでコチラでやってみるっ\(^o^)/
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問