in reply to Re^2: Perl & Unicode: state of the art?
in thread Perl & Unicode: state of the art?
#!/usr/bin/perl use warnings; use strict; use open IO => ':utf8', ':std'; my ($words, $sentences); while (<>) { $words++ for m/\p{L}+/g; $sentences++ for m/\./g; } print "$words $sentences\n";
Tested on the following text:
Огонь XXII Зимних олимпийских игр в Сочи во второй раз погас в понедельник в Москве, во время этапа эстафеты олимпийского огня. После нескольких безуспешных попыток снова его зажечь, факел был заменен, передает портал Sports.ru. Казус произошел на Раушской набережной, недалеко от Кремля. Видно, как зрители приветствуют факелоносца, он машет в ответ, и через какое-то время факел гаснет.Output:
59 5
|
|---|
| Replies are listed 'Best First'. | |
|---|---|
|
Re^4: Perl & Unicode: state of the art?
by Jenda (Abbot) on Oct 08, 2013 at 14:53 UTC | |
|
Re^4: Perl & Unicode: state of the art?
by BrowserUk (Patriarch) on Oct 07, 2013 at 22:42 UTC | |
by choroba (Cardinal) on Oct 07, 2013 at 22:48 UTC |