- ExtractContent のほうを使ったサンプルだったのでタイトル修正。
Lingua::JA::Summarize のほうも直に使ってみたいし、 ExtractContent がどういう風にして文章(センテンス)を取り出しているのかに興味があるのであとでソースを読もう、 Lingua::JA::Summarize のほうのソースは、読んでも意味わからんと思うけど一応読もう。
#!/usr/bin/perl use strict; use warnings; use Lingua::JA::Summarize::Extract; use Perl6::Say; use Getopt::Long; use Pod::Usage; my $help; GetOptions( 'help' => \$help, ) or pod2usage(2); $help and pod2usage(2); my $text = do { local $/; <> }; my $summary = Lingua::JA::Summarize::Extract->extract($text); say 'original'; say $text; say 'summary'; say $summary; __END__ =head1 NAME summarize_extract.pl - =head1 SYNOPSIS $ curl http://blog.livedoor.jp/tabbata/archives/50684381.html | ./content_extract.pl | ./summarize_extract.pl =head1 DESCRIPTION =cut
My Gists でどれがどれやらわからないのは困るなあ・・・ gisty とか前試したけどうまく動かなかったんだよな。ああいうの使うようにしたほうがいいだろうか。でも gist にそんな重要な(あとから何度も参照したくなるような)ファイル置くなよとも思うし。