File Coverage

blib/lib/Text/Demoroniser.pm
Criterion Covered Total %
statement 29 29 100.0
branch 4 4 100.0
condition n/a
subroutine 7 7 100.0
pod 2 2 100.0
total 42 42 100.0


line stmt bran cond sub pod time code
1             package Text::Demoroniser;
2              
3 6     6   96138 use strict;
  6         11  
  6         194  
4 6     6   21 use warnings;
  6         7  
  6         182  
5              
6 6     6   23 use vars qw( $VERSION @ISA @EXPORT @EXPORT_OK %EXPORT_TAGS );
  6         9  
  6         443  
7 6     6   3051 use Encode::ZapCP1252;
  6         62618  
  6         742  
8              
9             BEGIN {
10 6     6   47 require Exporter;
11 6         12 $VERSION = '0.07';
12 6         61 @ISA = qw( Exporter );
13 6         12 @EXPORT = qw();
14 6         19 %EXPORT_TAGS = (
15             'all' => [ qw( demoroniser demoroniser_utf8 ) ]
16             );
17 6         15 @EXPORT_OK = ( @{ $EXPORT_TAGS{'all'} } );
  6         1597  
18             }
19              
20             my %character = ( # ASCII UTF8
21             "\xE2\x80\x9A" => [ ',', "\x201A" ], # 82 - SINGLE LOW-9 QUOTATION MARK
22             "\xE2\x80\x9E" => [ ',,', "\x201E" ], # 84 - DOUBLE LOW-9 QUOTATION MARK
23             "\xE2\x80\xA6" => [ '...', "\x2026" ], # 85 - HORIZONTAL ELLIPSIS
24             "\xCB\x86" => [ '^', "\x02C6" ], # 88 - MODIFIER LETTER CIRCUMFLEX ACCENT
25             "\xE2\x80\x98" => [ '`', "\x2018" ], # 91 - LEFT SINGLE QUOTATION MARK
26             "\xE2\x80\x99" => [ q{'}, "\x2019" ], # 92 - RIGHT SINGLE QUOTATION MARK
27             "\xE2\x80\x9C" => [ '"', "\x201C" ], # 93 - LEFT DOUBLE QUOTATION MARK
28             "\xE2\x80\x9D" => [ '"', "\x201D" ], # 94 - RIGHT DOUBLE QUOTATION MARK
29             "\xE2\x80\xA2" => [ '*', "\x2022" ], # 95 - BULLET
30             "\xE2\x80\x93" => [ '-', "\x2013" ], # 96 - EN DASH
31             "\xE2\x80\x94" => [ '-', "\x2014" ], # 97 - EM DASH
32              
33             "\xE2\x80\xB9" => [ '<', "\x2039" ], # 8B - SINGLE LEFT-POINTING ANGLE
34             # QUOTATION MARK
35             "\xE2\x80\xBA" => [ '>', "\x203A" ], # 9B - SINGLE RIGHT-POINTING ANGLE
36             # QUOTATION MARK
37             );
38              
39             my $characters_re = '(' . join( '|', keys %character ) . ')';
40              
41             sub demoroniser {
42 4     4 1 875 my $str = shift;
43 4 100       12 return unless(defined $str);
44              
45 3         46 $str =~ s/$characters_re/$character{$1}[0]/g;
46              
47 3         80 zap_cp1252($str);
48              
49 3         67 return $str;
50             }
51              
52             sub demoroniser_utf8 {
53 4     4 1 5 my $str = shift;
54 4 100       11 return unless(defined $str);
55              
56 3         39 $str =~ s/$characters_re/$character{$1}[1]/g;
57              
58 3         71 fix_cp1252($str);
59              
60 3         53 return $str;
61             }
62              
63             1;
64              
65             __END__