File Coverage

blib/lib/Lingua/Identify/PT.pm
Criterion Covered Total %
statement 6 6 100.0
branch n/a
condition n/a
subroutine 2 2 100.0
pod n/a
total 8 8 100.0


line stmt bran cond sub pod time code
1 7     7   38 use utf8;
  7         17  
  7         43  
2 7     7   198 use strict;
  7         14  
  7         6597  
3              
4             ${Lingua::Identify::languages{'_versions'}{'pt'}} = '0.02';
5              
6             ${Lingua::Identify::languages{'_names'}{'pt'}} = 'portuguese';
7              
8             ${Lingua::Identify::languages{'_sets'}{'pt'}} = '';
9              
10              
11             =head1 NAME
12              
13             Lingua::Identify::PT - Meta-information on Portuguese
14              
15             =head1 SYNOPSIS
16              
17             Nothing here is meant for public consumption. This module is to be
18             loaded by Lingua::Identify.
19              
20             =head1 DESCRIPTION
21              
22             Automatically generated. Do not change this module yourself unless
23             you know what you're doing.
24              
25             =head1 SEE ALSO
26              
27             Lingua::Identify(3).
28              
29             =head1 AUTHOR
30              
31             Jose Castro, C<< >>
32              
33             =head1 COPYRIGHT AND LICENSE
34              
35             Copyright (C) 2010 by Alberto Simoes
36              
37             This library is free software; you can redistribute it and/or modify
38             it under the same terms as Perl itself, either Perl version 5.8.4 or,
39             at your option, any later version of Perl 5 you may have available.
40              
41             =cut
42              
43             ${Lingua::Identify::languages{'prefixes1'}{'pt'}} = {
44             'd' => 0.152189963061362,
45             'p' => 0.086118381212766,
46             'c' => 0.0704642210218402,
47             'a' => 0.0693132622484047,
48             'e' => 0.0605035016932544,
49             's' => 0.0577541201639895,
50             'n' => 0.0439850900399591,
51             'm' => 0.0399051152182884,
52             'q' => 0.0388733228580943,
53             't' => 0.032869872341505,
54             'f' => 0.0285474351641798,
55             'o' => 0.0273230297647614,
56             'r' => 0.024734699873194,
57             'u' => 0.0228410157815857,
58             'i' => 0.0211077933949361,
59             'v' => 0.0175522687780753,
60             'P' => 0.0149247083593764,
61             'C' => 0.0143866897015737,
62             'l' => 0.0139106139813469,
63             'A' => 0.0131625792685247,
64             };
65              
66             ${Lingua::Identify::languages{'prefixes2'}{'pt'}} = {
67             'co' => 0.0520762382129872,
68             'qu' => 0.0484397382366963,
69             'pa' => 0.0287490447433222,
70             'pr' => 0.0279638871622692,
71             'po' => 0.0272331318855214,
72             'de' => 0.0255308543771616,
73             're' => 0.0254194766865909,
74             'se' => 0.0246335839392635,
75             'es' => 0.0232371356010517,
76             'pe' => 0.0177924941728883,
77             'ma' => 0.0172984624364954,
78             'in' => 0.0162640834884228,
79             'di' => 0.0159439185759241,
80             'te' => 0.01494776827412,
81             'do' => 0.0138608249374282,
82             'ca' => 0.0129396615956122,
83             'um' => 0.0119685069471375,
84             'en' => 0.0111980526915724,
85             'me' => 0.0106996099575331,
86             'nã' => 0.0105250079673645,
87             };
88              
89             ${Lingua::Identify::languages{'prefixes3'}{'pt'}} = {
90             'con' => 0.0262230277588871,
91             'par' => 0.0243294288315679,
92             'est' => 0.0173064362190245,
93             'com' => 0.0156401229584076,
94             'pro' => 0.0145108673481053,
95             'des' => 0.0120891766744834,
96             'mai' => 0.00952941107907793,
97             'pel' => 0.00941823386933002,
98             'pre' => 0.0092586407779177,
99             'qua' => 0.0081840771820881,
100             'ent' => 0.00710547892945313,
101             'res' => 0.00652045369267481,
102             'tra' => 0.00605422668405454,
103             'per' => 0.00595022219751618,
104             'pri' => 0.00577718025008596,
105             'for' => 0.00575745526125972,
106             'dis' => 0.00559158603703905,
107             'int' => 0.00550775483452752,
108             'rec' => 0.00523294987656192,
109             'por' => 0.00517332661488259,
110             };
111              
112             ${Lingua::Identify::languages{'prefixes4'}{'pt'}} = {
113             'cont' => 0.0109587909732807,
114             'cons' => 0.00778954939584209,
115             'part' => 0.00590514961245659,
116             'entr' => 0.00578753797549078,
117             'inte' => 0.00575303856198081,
118             'esta' => 0.00537093142143856,
119             'pres' => 0.00467780684092007,
120             'comp' => 0.00457639947393622,
121             'segu' => 0.0045047870549837,
122             'Port' => 0.00447394667017933,
123             'pass' => 0.0044551288082648,
124             'sobr' => 0.00422460999981182,
125             'outr' => 0.00416920185084126,
126             'prim' => 0.00398311410524203,
127             'cent' => 0.00395959177784887,
128             'muit' => 0.00387543411762,
129             'port' => 0.00368777821686122,
130             'dest' => 0.00367157394687927,
131             'conc' => 0.00365171064819171,
132             'aind' => 0.00348182717257443,
133             };
134              
135             ${Lingua::Identify::languages{'suffixes1'}{'pt'}} = {
136             'o' => 0.216256820777837,
137             's' => 0.193733666381006,
138             'a' => 0.185662191584141,
139             'e' => 0.169346843846771,
140             'm' => 0.0729633148538241,
141             'r' => 0.0567325453510262,
142             'l' => 0.0261588396927128,
143             'u' => 0.0211389593871231,
144             'á' => 0.0110054849132469,
145             'i' => 0.00965518013690475,
146             'z' => 0.00533756440617828,
147             'n' => 0.00432056270754084,
148             'é' => 0.00298499281527053,
149             't' => 0.0019995237685468,
150             'd' => 0.00169274348217138,
151             'ó' => 0.00155453026957765,
152             'y' => 0.00141661175466536,
153             'P' => 0.00134558961343916,
154             'g' => 0.00118556877241913,
155             'A' => 0.00114136412020365,
156             };
157              
158             ${Lingua::Identify::languages{'suffixes2'}{'pt'}} = {
159             'os' => 0.0749514314665271,
160             'as' => 0.059924599282024,
161             'ão' => 0.0560652208121865,
162             'es' => 0.0427811202602479,
163             'ue' => 0.0405004948769573,
164             'do' => 0.0394805924405155,
165             'ra' => 0.0380786861715348,
166             'to' => 0.0324416479035012,
167             'te' => 0.03082723132152,
168             'ia' => 0.0265979819608893,
169             'ar' => 0.0241342594567089,
170             'ma' => 0.0216153872173208,
171             'is' => 0.021573473418563,
172             'da' => 0.021241104347711,
173             'al' => 0.0210922000626501,
174             'or' => 0.0204370212083822,
175             'er' => 0.0195042553535686,
176             'em' => 0.0192443162682895,
177             'ta' => 0.0190726167593427,
178             'de' => 0.0177868925991997,
179             };
180              
181             ${Lingua::Identify::languages{'suffixes3'}{'pt'}} = {
182             'ção' => 0.0310741960879959,
183             'nte' => 0.0242200291597996,
184             'ara' => 0.0199388648480947,
185             'ado' => 0.0192614285432474,
186             'nto' => 0.0176362090825782,
187             'ais' => 0.0164306324950638,
188             'dos' => 0.0145027859624079,
189             'ões' => 0.0142458892035214,
190             'ndo' => 0.0139437104679377,
191             'tos' => 0.0132003687118578,
192             'ada' => 0.0119804453594492,
193             'res' => 0.0111111210741423,
194             'ade' => 0.0110062103558536,
195             'sta' => 0.0100508054811815,
196             'ica' => 0.00994948145411636,
197             'tes' => 0.00977463025696849,
198             'ram' => 0.00969975807767697,
199             'ria' => 0.00914606262004207,
200             'das' => 0.0083417471131619,
201             'cia' => 0.0081000937919755,
202             };
203              
204             ${Lingua::Identify::languages{'suffixes4'}{'pt'}} = {
205             'ação' => 0.0232592543029228,
206             'ente' => 0.0212838251083898,
207             'ento' => 0.0134500643491225,
208             'dade' => 0.0119947600682069,
209             'ções' => 0.0110679445186152,
210             'ados' => 0.00986930489356519,
211             'ntes' => 0.00853318501496601,
212             'ando' => 0.00801044640831531,
213             'eira' => 0.00767223452981231,
214             'ores' => 0.00756977776290877,
215             'ncia' => 0.00732252240196299,
216             'ntos' => 0.00697071931968707,
217             'eiro' => 0.00601672136254954,
218             'ante' => 0.00574071537823797,
219             'adas' => 0.00526815967782574,
220             'tado' => 0.00500104024982724,
221             'ição' => 0.00488081037029757,
222             'stas' => 0.00479194480716696,
223             'ista' => 0.00476476239962112,
224             'ário' => 0.00472869343576222,
225             };
226              
227             ${Lingua::Identify::languages{'smallwords'}{'pt'}} = {
228             'de' => 0.0430133932745471,
229             'a' => 0.029736597657219,
230             'que' => 0.022692889220427,
231             'o' => 0.0207708742295662,
232             'e' => 0.0199284859924512,
233             'do' => 0.0156198920778782,
234             'da' => 0.015303574055704,
235             'em' => 0.0101417776126596,
236             'um' => 0.00835471596601699,
237             'para' => 0.0083206960077917,
238             'os' => 0.00812491227469381,
239             'uma' => 0.00727463861679806,
240             'com' => 0.00709327393884203,
241             'não' => 0.00641918311096071,
242             'no' => 0.00629391756941592,
243             'dos' => 0.00607673055134186,
244             'por' => 0.00597106591288052,
245             'na' => 0.00578744825755857,
246             'é' => 0.00540601918950942,
247             'se' => 0.00521203783830426,
248             };
249              
250             ${Lingua::Identify::languages{'ngrams1'}{'pt'}} = {
251             'a' => 0.123692471695767,
252             'e' => 0.115792320843729,
253             'o' => 0.103691513568575,
254             's' => 0.0790681216774899,
255             'r' => 0.0689517187625363,
256             'i' => 0.0655977966466184,
257             'd' => 0.0541838415028691,
258             'n' => 0.0531845381588463,
259             't' => 0.0494705764332719,
260             'm' => 0.0424123904499732,
261             'u' => 0.038617666233213,
262             'c' => 0.0376233972964491,
263             'p' => 0.0292979715154297,
264             'l' => 0.0280546848975095,
265             'v' => 0.0134649196672882,
266             'g' => 0.0123998510663352,
267             'f' => 0.0103359030714442,
268             'b' => 0.00982907074486864,
269             'q' => 0.00940893621066843,
270             'ã' => 0.00841328943612837,
271             };
272              
273             ${Lingua::Identify::languages{'ngrams2'}{'pt'}} = {
274             'de' => 0.0251124618700597,
275             'es' => 0.0220355085577785,
276             'os' => 0.0190615342193951,
277             'do' => 0.0179899154968218,
278             'ra' => 0.0178542700785927,
279             'nt' => 0.0165629495993281,
280             'as' => 0.016162188099362,
281             're' => 0.0159152643057282,
282             'en' => 0.0154345629704474,
283             'co' => 0.0152963945341602,
284             'ar' => 0.0152355101247055,
285             'er' => 0.0148407905890364,
286             'te' => 0.0146870192779162,
287             'da' => 0.0146228815030707,
288             'or' => 0.0128594246708806,
289             'ta' => 0.0124956453040293,
290             'qu' => 0.011772003887838,
291             'an' => 0.0117099907597783,
292             'se' => 0.0115244825372957,
293             'ma' => 0.0112886467440751,
294             };
295              
296             ${Lingua::Identify::languages{'ngrams3'}{'pt'}} = {
297             'que' => 0.0115054080550109,
298             'ent' => 0.0113316484016254,
299             'nte' => 0.00881650312296134,
300             'est' => 0.0067832238653229,
301             'con' => 0.00656542453647385,
302             'ado' => 0.00648402824913844,
303             'com' => 0.00646492154169024,
304             'res' => 0.00617026698153607,
305             'ção' => 0.00594235737699693,
306             'par' => 0.00589326256368831,
307             'ara' => 0.00549793364814561,
308             'men' => 0.00541568055778562,
309             'dos' => 0.00517560435029741,
310             'por' => 0.00503517433456822,
311             'sta' => 0.00500604303173239,
312             'nto' => 0.00489988513698652,
313             'ica' => 0.00433062520745343,
314             'tra' => 0.00391601822385761,
315             'ida' => 0.00389494086945286,
316             'ant' => 0.00389297022249632,
317             };
318              
319             ${Lingua::Identify::languages{'ngrams4'}{'pt'}} = {
320             'ment' => 0.00613569444123265,
321             'ente' => 0.0058691436895115,
322             'ação' => 0.0049731935517061,
323             'para' => 0.00489812142045856,
324             'ento' => 0.00378041803782228,
325             'dade' => 0.00333032039378014,
326             'esta' => 0.00323167650703673,
327             'cont' => 0.00319112415042534,
328             'amen' => 0.00290290078938569,
329             'idad' => 0.00288145160902926,
330             'port' => 0.00258261537229242,
331             'ante' => 0.00258116308403912,
332             'pres' => 0.00253536014681964,
333             'ncia' => 0.00238599788569173,
334             'ções' => 0.00236622442255064,
335             'ados' => 0.00211654255746397,
336             'enta' => 0.00206828190166199,
337             'mais' => 0.00206224931968674,
338             'eira' => 0.00196997315836164,
339             'cons' => 0.00196047742747468,
340             };