@kyanny's blog

My thoughts, my life. Views/opinions are my own.

2008-03-07から1日間の記事一覧

UTF-8 の範囲外の文字かどうか、どうやって判別したらいいのだろう

すごく大きな UTF-8 でかかれたテキストファイルがあり、その中にごく一部だけ '????' とか文字化けしているものがあり、文字化けを含む行だけ抜き出したいのだけど、 Perl で(他の言語でも) どうやればいいのかわからない。Encode とかでできるのだろうか・…