File Coverage

blib/lib/Lingua/Identify/PT.pm
Criterion Covered Total %
statement 6 6 100.0
branch n/a
condition n/a
subroutine 2 2 100.0
pod n/a
total 8 8 100.0


line stmt bran cond sub pod time code
1 7     7   38 use utf8;
  7         14  
  7         44  
2 7     7   173 use strict;
  7         18  
  7         8579  
3              
4             ${Lingua::Identify::languages{'_versions'}{'pt'}} = '0.03';
5              
6             ${Lingua::Identify::languages{'_names'}{'pt'}} = 'portuguese';
7              
8             ${Lingua::Identify::languages{'_sets'}{'pt'}} = '';
9              
10              
11             =head1 NAME
12              
13             Lingua::Identify::PT - Meta-information on Portuguese
14              
15             =head1 SYNOPSIS
16              
17             Nothing here is meant for public consumption. This module is to be
18             loaded by Lingua::Identify.
19              
20             =head1 DESCRIPTION
21              
22             Automatically generated. Do not change this module yourself unless
23             you know what you're doing.
24              
25             =head1 SEE ALSO
26              
27             Lingua::Identify(3).
28              
29             =head1 AUTHOR
30              
31             Jose Castro, C<< >>
32              
33             =head1 COPYRIGHT AND LICENSE
34              
35             Copyright (C) 2010 by Alberto Simoes
36              
37             This library is free software; you can redistribute it and/or modify
38             it under the same terms as Perl itself, either Perl version 5.8.4 or,
39             at your option, any later version of Perl 5 you may have available.
40              
41             =cut
42              
43             ${Lingua::Identify::languages{'prefixes1'}{'pt'}} = {
44             'd' => 0.152189963061362,
45             'p' => 0.086118381212766,
46             'c' => 0.0704642210218402,
47             'a' => 0.0693132622484047,
48             'e' => 0.0605035016932544,
49             's' => 0.0577541201639895,
50             'n' => 0.0439850900399591,
51             'm' => 0.0399051152182884,
52             'q' => 0.0388733228580943,
53             't' => 0.032869872341505,
54             'f' => 0.0285474351641798,
55             'o' => 0.0273230297647614,
56             'r' => 0.024734699873194,
57             'u' => 0.0228410157815857,
58             'i' => 0.0211077933949361,
59             'v' => 0.0175522687780753,
60             'P' => 0.0149247083593764,
61             'C' => 0.0143866897015737,
62             'l' => 0.0139106139813469,
63             'A' => 0.0131625792685247,
64             };
65              
66             ${Lingua::Identify::languages{'prefixes2'}{'pt'}} = {
67             'co' => 0.0520762382129872,
68             'qu' => 0.0484397382366963,
69             'pa' => 0.0287490447433222,
70             'pr' => 0.0279638871622692,
71             'po' => 0.0272331318855214,
72             'de' => 0.0255308543771616,
73             're' => 0.0254194766865909,
74             'se' => 0.0246335839392635,
75             'es' => 0.0232371356010517,
76             'pe' => 0.0177924941728883,
77             'ma' => 0.0172984624364954,
78             'in' => 0.0162640834884228,
79             'di' => 0.0159439185759241,
80             'te' => 0.01494776827412,
81             'do' => 0.0138608249374282,
82             'ca' => 0.0129396615956122,
83             'um' => 0.0119685069471375,
84             'en' => 0.0111980526915724,
85             'me' => 0.0106996099575331,
86             'nã' => 0.0105250079673645,
87             };
88              
89             ${Lingua::Identify::languages{'prefixes3'}{'pt'}} = {
90             'con' => 0.0262230277588871,
91             'par' => 0.0243294288315679,
92             'est' => 0.0173064362190245,
93             'com' => 0.0156401229584076,
94             'pro' => 0.0145108673481053,
95             'des' => 0.0120891766744834,
96             'mai' => 0.00952941107907793,
97             'pel' => 0.00941823386933002,
98             'pre' => 0.0092586407779177,
99             'qua' => 0.0081840771820881,
100             'ent' => 0.00710547892945313,
101             'res' => 0.00652045369267481,
102             'tra' => 0.00605422668405454,
103             'per' => 0.00595022219751618,
104             'pri' => 0.00577718025008596,
105             'for' => 0.00575745526125972,
106             'dis' => 0.00559158603703905,
107             'int' => 0.00550775483452752,
108             'rec' => 0.00523294987656192,
109             'por' => 0.00517332661488259,
110             };
111              
112             ${Lingua::Identify::languages{'prefixes4'}{'pt'}} = {
113             'cont' => 0.0109587909732807,
114             'cons' => 0.00778954939584209,
115             'part' => 0.00590514961245659,
116             'entr' => 0.00578753797549078,
117             'inte' => 0.00575303856198081,
118             'esta' => 0.00537093142143856,
119             'pres' => 0.00467780684092007,
120             'comp' => 0.00457639947393622,
121             'segu' => 0.0045047870549837,
122             'Port' => 0.00447394667017933,
123             'pass' => 0.0044551288082648,
124             'sobr' => 0.00422460999981182,
125             'outr' => 0.00416920185084126,
126             'prim' => 0.00398311410524203,
127             'cent' => 0.00395959177784887,
128             'muit' => 0.00387543411762,
129             'port' => 0.00368777821686122,
130             'dest' => 0.00367157394687927,
131             'conc' => 0.00365171064819171,
132             'aind' => 0.00348182717257443,
133             };
134              
135             ${Lingua::Identify::languages{'suffixes1'}{'pt'}} = {
136             'o' => 0.216256820777837,
137             's' => 0.193733666381006,
138             'a' => 0.185662191584141,
139             'e' => 0.169346843846771,
140             'm' => 0.0729633148538241,
141             'r' => 0.0567325453510262,
142             'l' => 0.0261588396927128,
143             'u' => 0.0211389593871231,
144             'á' => 0.0110054849132469,
145             'i' => 0.00965518013690475,
146             'z' => 0.00533756440617828,
147             'n' => 0.00432056270754084,
148             'é' => 0.00298499281527053,
149             't' => 0.0019995237685468,
150             'd' => 0.00169274348217138,
151             'ó' => 0.00155453026957765,
152             'y' => 0.00141661175466536,
153             'P' => 0.00134558961343916,
154             'g' => 0.00118556877241913,
155             'A' => 0.00114136412020365,
156             };
157              
158             ${Lingua::Identify::languages{'suffixes2'}{'pt'}} = {
159             'os' => 0.0749514314665271,
160             'as' => 0.059924599282024,
161             'ão' => 0.0560652208121865,
162             'es' => 0.0427811202602479,
163             'ue' => 0.0405004948769573,
164             'do' => 0.0394805924405155,
165             'ra' => 0.0380786861715348,
166             'to' => 0.0324416479035012,
167             'te' => 0.03082723132152,
168             'ia' => 0.0265979819608893,
169             'ar' => 0.0241342594567089,
170             'ma' => 0.0216153872173208,
171             'is' => 0.021573473418563,
172             'da' => 0.021241104347711,
173             'al' => 0.0210922000626501,
174             'or' => 0.0204370212083822,
175             'er' => 0.0195042553535686,
176             'em' => 0.0192443162682895,
177             'ta' => 0.0190726167593427,
178             'de' => 0.0177868925991997,
179             };
180              
181             ${Lingua::Identify::languages{'suffixes3'}{'pt'}} = {
182             'ção' => 0.0310741960879959,
183             'nte' => 0.0242200291597996,
184             'ara' => 0.0199388648480947,
185             'ado' => 0.0192614285432474,
186             'nto' => 0.0176362090825782,
187             'ais' => 0.0164306324950638,
188             'dos' => 0.0145027859624079,
189             'ões' => 0.0142458892035214,
190             'ndo' => 0.0139437104679377,
191             'tos' => 0.0132003687118578,
192             'ada' => 0.0119804453594492,
193             'res' => 0.0111111210741423,
194             'ade' => 0.0110062103558536,
195             'sta' => 0.0100508054811815,
196             'ica' => 0.00994948145411636,
197             'tes' => 0.00977463025696849,
198             'ram' => 0.00969975807767697,
199             'ria' => 0.00914606262004207,
200             'das' => 0.0083417471131619,
201             'cia' => 0.0081000937919755,
202             };
203              
204             ${Lingua::Identify::languages{'suffixes4'}{'pt'}} = {
205             'ação' => 0.0232592543029228,
206             'ente' => 0.0212838251083898,
207             'ento' => 0.0134500643491225,
208             'dade' => 0.0119947600682069,
209             'ções' => 0.0110679445186152,
210             'ados' => 0.00986930489356519,
211             'ntes' => 0.00853318501496601,
212             'ando' => 0.00801044640831531,
213             'eira' => 0.00767223452981231,
214             'ores' => 0.00756977776290877,
215             'ncia' => 0.00732252240196299,
216             'ntos' => 0.00697071931968707,
217             'eiro' => 0.00601672136254954,
218             'ante' => 0.00574071537823797,
219             'adas' => 0.00526815967782574,
220             'tado' => 0.00500104024982724,
221             'ição' => 0.00488081037029757,
222             'stas' => 0.00479194480716696,
223             'ista' => 0.00476476239962112,
224             'ário' => 0.00472869343576222,
225             };
226              
227             ${Lingua::Identify::languages{'smallwords'}{'pt'}} = {
228             'de' => 0.0430133932745471,
229             'a' => 0.029736597657219,
230             'que' => 0.022692889220427,
231             'o' => 0.0207708742295662,
232             'e' => 0.0199284859924512,
233             'do' => 0.0156198920778782,
234             'da' => 0.015303574055704,
235             'em' => 0.0101417776126596,
236             'um' => 0.00835471596601699,
237             'para' => 0.0083206960077917,
238             'os' => 0.00812491227469381,
239             'uma' => 0.00727463861679806,
240             'com' => 0.00709327393884203,
241             'não' => 0.00641918311096071,
242             'no' => 0.00629391756941592,
243             'dos' => 0.00607673055134186,
244             'por' => 0.00597106591288052,
245             'na' => 0.00578744825755857,
246             'é' => 0.00540601918950942,
247             'se' => 0.00521203783830426,
248             };
249              
250             ${Lingua::Identify::languages{'ngrams2'}{'pt'}} = {
251             'de' => 0.0251124618700597,
252             'es' => 0.0220355085577785,
253             'os' => 0.0190615342193951,
254             'do' => 0.0179899154968218,
255             'ra' => 0.0178542700785927,
256             'nt' => 0.0165629495993281,
257             'as' => 0.016162188099362,
258             're' => 0.0159152643057282,
259             'en' => 0.0154345629704474,
260             'co' => 0.0152963945341602,
261             'ar' => 0.0152355101247055,
262             'er' => 0.0148407905890364,
263             'te' => 0.0146870192779162,
264             'da' => 0.0146228815030707,
265             'or' => 0.0128594246708806,
266             'ta' => 0.0124956453040293,
267             'qu' => 0.011772003887838,
268             'an' => 0.0117099907597783,
269             'se' => 0.0115244825372957,
270             'ma' => 0.0112886467440751,
271             'ad' => 0.0110793690356766,
272             'to' => 0.0109561395221019,
273             'st' => 0.0109151736762637,
274             'em' => 0.010358980984876,
275             'is' => 0.0103018147072964,
276             'ão' => 0.0102459763339578,
277             'al' => 0.0100351715356821,
278             'ue' => 0.00995430216739866,
279             'in' => 0.00991187562689529,
280             'on' => 0.00990556808175003,
281             'ri' => 0.00951874957631555,
282             'ia' => 0.00920523138499018,
283             'ca' => 0.00908246663789983,
284             'po' => 0.00895917072911304,
285             'me' => 0.00869564813246535,
286             'ro' => 0.00843571087726865,
287             'na' => 0.0083252956396206,
288             'pa' => 0.00831394205835913,
289             'pr' => 0.00754395678415322,
290             'ti' => 0.00745983405047908,
291             'ci' => 0.00740346451544409,
292             'no' => 0.00740280056332354,
293             'tr' => 0.0072764504747822,
294             'am' => 0.00722047931101954,
295             'om' => 0.0067802126598805,
296             'ic' => 0.00669755062087159,
297             'um' => 0.00661522055792295,
298             'nd' => 0.00653607746515297,
299             'el' => 0.00641663247866539,
300             'pe' => 0.00636783199780471,
301             };
302              
303             ${Lingua::Identify::languages{'ngrams3'}{'pt'}} = {
304             'que' => 0.0115054080550109,
305             'ent' => 0.0113316484016254,
306             'nte' => 0.00881650312296134,
307             'est' => 0.0067832238653229,
308             'con' => 0.00656542453647385,
309             'ado' => 0.00648402824913844,
310             'com' => 0.00646492154169024,
311             'res' => 0.00617026698153607,
312             'ção' => 0.00594235737699693,
313             'par' => 0.00589326256368831,
314             'ara' => 0.00549793364814561,
315             'men' => 0.00541568055778562,
316             'dos' => 0.00517560435029741,
317             'por' => 0.00503517433456822,
318             'sta' => 0.00500604303173239,
319             'nto' => 0.00489988513698652,
320             'ica' => 0.00433062520745343,
321             'tra' => 0.00391601822385761,
322             'ida' => 0.00389494086945286,
323             'ant' => 0.00389297022249632,
324             'ont' => 0.00386469572268508,
325             'açã' => 0.00381620067149367,
326             'pre' => 0.0037306060493378,
327             'uma' => 0.00371304158733385,
328             'cia' => 0.00362401975307965,
329             'ist' => 0.00358477817455374,
330             'des' => 0.00346970952835221,
331             'ter' => 0.00344434815882455,
332             'ada' => 0.00339456790309626,
333             'pro' => 0.00329260834317086,
334             'ais' => 0.00319433303625116,
335             'das' => 0.00306427033711943,
336             'dad' => 0.00304507794936877,
337             'eir' => 0.00301534688441573,
338             'ade' => 0.00301534688441573,
339             'ria' => 0.00297893275587094,
340             'ndo' => 0.0029533143454359,
341             'nta' => 0.00285469631730638,
342             'não' => 0.00273165940297623,
343             'ões' => 0.00272351977424268,
344             'and' => 0.00270844004101002,
345             'ntr' => 0.00266465740645382,
346             'ort' => 0.00265000607473344,
347             'ess' => 0.00265000607473344,
348             'ame' => 0.00258531744637741,
349             'ran' => 0.00257786326006354,
350             'tos' => 0.0025744360479652,
351             'era' => 0.00253210997855079,
352             'nci' => 0.00249972282422155,
353             'ver' => 0.00242680888682952,
354             };
355              
356             ${Lingua::Identify::languages{'ngrams4'}{'pt'}} = {
357             'ment' => 0.00613569444123265,
358             'ente' => 0.0058691436895115,
359             'ação' => 0.0049731935517061,
360             'para' => 0.00489812142045856,
361             'ento' => 0.00378041803782228,
362             'dade' => 0.00333032039378014,
363             'esta' => 0.00323167650703673,
364             'cont' => 0.00319112415042534,
365             'amen' => 0.00290290078938569,
366             'idad' => 0.00288145160902926,
367             'port' => 0.00258261537229242,
368             'ante' => 0.00258116308403912,
369             'pres' => 0.00253536014681964,
370             'ncia' => 0.00238599788569173,
371             'ções' => 0.00236622442255064,
372             'ados' => 0.00211654255746397,
373             'enta' => 0.00206828190166199,
374             'mais' => 0.00206224931968674,
375             'eira' => 0.00196997315836164,
376             'cons' => 0.00196047742747468,
377             'entr' => 0.00192059535774943,
378             'ntes' => 0.00189836417602583,
379             'ista' => 0.00188395300797384,
380             'ando' => 0.00184485293961575,
381             'eiro' => 0.00182318033029727,
382             'tado' => 0.00180117257753571,
383             'como' => 0.00167035492025764,
384             'iona' => 0.00166063576040863,
385             'ores' => 0.00165650232461078,
386             'este' => 0.00163963343797629,
387             'ênci' => 0.0016063425226314,
388             'segu' => 0.00158757448981952,
389             'inte' => 0.00157573275483106,
390             'ário' => 0.00154657527528403,
391             'cent' => 0.00151507179163551,
392             'ntos' => 0.00150267148424195,
393             'part' => 0.00148859545963303,
394             'cion' => 0.00146033169593418,
395             'onte' => 0.00144457995410993,
396             'ador' => 0.00142301905927246,
397             'ontr' => 0.00141598104696801,
398             'ntra' => 0.0013941967231685,
399             'açõe' => 0.0013657095305076,
400             'pelo' => 0.00136057066438054,
401             'nter' => 0.00131934802088301,
402             'tura' => 0.00126416106725759,
403             'esso' => 0.00124852103991436,
404             'dent' => 0.0012443876041165,
405             'arti' => 0.00123846673662227,
406             'ortu' => 0.00122059241965858,
407             };
408              
409             ${Lingua::Identify::languages{'letters'}{'pt'}} = {
410             'a' => 0.123692471695767,
411             'e' => 0.115792320843729,
412             'o' => 0.103691513568575,
413             's' => 0.0790681216774899,
414             'r' => 0.0689517187625363,
415             'i' => 0.0655977966466184,
416             'd' => 0.0541838415028691,
417             'n' => 0.0531845381588463,
418             't' => 0.0494705764332719,
419             'm' => 0.0424123904499732,
420             'u' => 0.038617666233213,
421             'c' => 0.0376233972964491,
422             'p' => 0.0292979715154297,
423             'l' => 0.0280546848975095,
424             'v' => 0.0134649196672882,
425             'g' => 0.0123998510663352,
426             'f' => 0.0103359030714442,
427             'b' => 0.00982907074486864,
428             'q' => 0.00940893621066843,
429             'ã' => 0.00841328943612837,
430             'h' => 0.00753762053563338,
431             'ç' => 0.00674387998905785,
432             'á' => 0.00471289411327289,
433             'é' => 0.00432328398519015,
434             'j' => 0.00358020547376793,
435             'z' => 0.00350919383453631,
436             'í' => 0.00296855148868483,
437             'x' => 0.00251333508495377,
438             'ó' => 0.0023658534491466,
439             'õ' => 0.00173893726100476,
440             'ê' => 0.00156972818334315,
441             'à' => 0.00130979378749905,
442             'ú' => 0.00127720262471737,
443             'k' => 0.000720238200594738,
444             'â' => 0.000546206690716648,
445             'y' => 0.000474082182511995,
446             'w' => 0.000373976968699659,
447             'º' => 8.7969642630216e-05,
448             'ô' => 8.16103913557426e-05,
449             'ª' => 3.8526463971185e-05,
450             'è' => 1.08107271666049e-05,
451             'ñ' => 6.78320135943834e-06,
452             'ü' => 5.98829495012916e-06,
453             'ä' => 3.17962563723672e-06,
454             'ö' => 2.86166307351305e-06,
455             'ë' => 2.17274418544509e-06,
456             'î' => 1.3248440155153e-06,
457             'ï' => 1.27185025489469e-06,
458             'ø' => 4.23950084964896e-07,
459             'ù' => 3.70956324344284e-07,
460             'å' => 3.17962563723672e-07,
461             'û' => 2.11975042482448e-07,
462             'ò' => 1.05987521241224e-07,
463             'ì' => 1.05987521241224e-07,
464             };