@kyanny's blog

My thoughts, my life. Views/opinions are my own.

Lingua::JA::Summarize::ExtractContent サンプル

ExtractContent のほうを使ったサンプルだったのでタイトル修正。

Lingua::JA::Summarize のほうも直に使ってみたいし、 ExtractContent がどういう風にして文章(センテンス)を取り出しているのかに興味があるのであとでソースを読もう、 Lingua::JA::Summarize のほうのソースは、読んでも意味わからんと思うけど一応読もう。

http://gist.github.com/114167

#!/usr/bin/perl
use strict;
use warnings;
use Lingua::JA::Summarize::Extract;
use Perl6::Say;
use Getopt::Long;
use Pod::Usage;
my $help;
GetOptions(
    'help' => \$help,
) or pod2usage(2);
$help and pod2usage(2);

my $text = do { local $/; <> };
my $summary = Lingua::JA::Summarize::Extract->extract($text);

say 'original';
say $text;
say 'summary';
say $summary;


__END__

=head1 NAME

summarize_extract.pl - 

=head1 SYNOPSIS

  $ curl http://blog.livedoor.jp/tabbata/archives/50684381.html | ./content_extract.pl | ./summarize_extract.pl 

=head1 DESCRIPTION



=cut

My Gists でどれがどれやらわからないのは困るなあ・・・ gisty とか前試したけどうまく動かなかったんだよな。ああいうの使うようにしたほうがいいだろうか。でも gist にそんな重要な(あとから何度も参照したくなるような)ファイル置くなよとも思うし。