File Coverage

blib/lib/Lingua/Identify/EN.pm
Criterion Covered Total %
statement 6 6 100.0
branch n/a
condition n/a
subroutine 2 2 100.0
pod n/a
total 8 8 100.0


line stmt bran cond sub pod time code
1 7     7   37 use utf8;
  7         13  
  7         47  
2 7     7   186 use strict;
  7         13  
  7         9523  
3              
4             ${Lingua::Identify::languages{'_versions'}{'en'}} = '0.03';
5              
6             ${Lingua::Identify::languages{'_names'}{'en'}} = 'english';
7              
8             ${Lingua::Identify::languages{'_sets'}{'en'}} = '';
9              
10              
11             =head1 NAME
12              
13             Lingua::Identify::EN - Meta-information on English
14              
15             =head1 SYNOPSIS
16              
17             Nothing here is meant for public consumption. This module is to be
18             loaded by Lingua::Identify.
19              
20             =head1 DESCRIPTION
21              
22             Automatically generated. Do not change this module yourself unless
23             you know what you're doing.
24              
25             =head1 SEE ALSO
26              
27             Lingua::Identify(3).
28              
29             =head1 AUTHOR
30              
31             Jose Castro, C<< >>
32              
33             =head1 COPYRIGHT AND LICENSE
34              
35             Copyright (C) 2010 by Alberto Simoes
36              
37             This library is free software; you can redistribute it and/or modify
38             it under the same terms as Perl itself, either Perl version 5.8.4 or,
39             at your option, any later version of Perl 5 you may have available.
40              
41             =cut
42              
43             ${Lingua::Identify::languages{'prefixes1'}{'en'}} = {
44             't' => 0.170758391694659,
45             'a' => 0.0952308999612686,
46             'i' => 0.0744895997155101,
47             'o' => 0.0713993554869753,
48             'w' => 0.0530210514273427,
49             's' => 0.0476842809668798,
50             'c' => 0.0448318008460267,
51             'p' => 0.0400873731407881,
52             'b' => 0.0368787637369075,
53             'f' => 0.0352433601788537,
54             'r' => 0.0311676009532618,
55             'm' => 0.0292978791441595,
56             'd' => 0.0250694684697226,
57             'h' => 0.0249516201728717,
58             'e' => 0.0237466041082881,
59             'n' => 0.0202326918067178,
60             'l' => 0.0163762613558205,
61             'E' => 0.0140146435123479,
62             'T' => 0.0131173424450972,
63             'C' => 0.0124012934367458,
64             };
65              
66             ${Lingua::Identify::languages{'prefixes2'}{'en'}} = {
67             'th' => 0.14773642550096,
68             'an' => 0.0420250770380145,
69             'co' => 0.0309584871050066,
70             're' => 0.0291803293568269,
71             'pr' => 0.0213847889712726,
72             'fo' => 0.0200085968783693,
73             'in' => 0.0183300661017392,
74             'ha' => 0.0182008319824622,
75             'wi' => 0.0181969419922498,
76             'wh' => 0.0156276034569911,
77             'be' => 0.0143957732230795,
78             'Th' => 0.0133469886397158,
79             'de' => 0.0131989529010791,
80             'ar' => 0.0122294808959339,
81             'al' => 0.012083174041836,
82             'Co' => 0.0119249811065336,
83             'ma' => 0.0118707373541281,
84             'no' => 0.0116243713073457,
85             'Eu' => 0.0114746066841702,
86             'po' => 0.0101749177321098,
87             };
88              
89             ${Lingua::Identify::languages{'prefixes3'}{'en'}} = {
90             'tha' => 0.033426693062962,
91             'pro' => 0.0190548257157897,
92             'the' => 0.018297267296821,
93             'thi' => 0.0174839219096881,
94             'con' => 0.0166794452200581,
95             'Eur' => 0.0151852127343053,
96             'wit' => 0.0132609914631634,
97             'hav' => 0.0124153182431969,
98             'com' => 0.0110601240473302,
99             'Com' => 0.00998357860526858,
100             'whi' => 0.00908126015608908,
101             'wil' => 0.00896053143524134,
102             'int' => 0.00843212871627034,
103             'res' => 0.00803933124299087,
104             'imp' => 0.00763051289680269,
105             'cou' => 0.00747688416908887,
106             'sho' => 0.00681230403039388,
107             'Pre' => 0.00655310919369235,
108             'par' => 0.00635256219531733,
109             'wor' => 0.0061328473668551,
110             };
111              
112             ${Lingua::Identify::languages{'prefixes4'}{'en'}} = {
113             'Euro' => 0.0198695043275931,
114             'Comm' => 0.0130219439034349,
115             'whic' => 0.0110534973226175,
116             'Pres' => 0.0085832898486506,
117             'inte' => 0.00763766355002265,
118             'woul' => 0.00719985257462747,
119             'shou' => 0.00714763311515942,
120             'poli' => 0.00710373849705584,
121             'Memb' => 0.00689750947234507,
122             'ther' => 0.00688048138773592,
123             'comp' => 0.00650813393761591,
124             'coun' => 0.00647521297403823,
125             'Stat' => 0.00640710063560164,
126             'cont' => 0.00616416662851114,
127             'cons' => 0.00611724479536594,
128             'Unio' => 0.00577138547686016,
129             'comm' => 0.00553374909609251,
130             'repo' => 0.00551331539456153,
131             'impo' => 0.00548228644038487,
132             'part' => 0.00541493090570868,
133             };
134              
135             ${Lingua::Identify::languages{'suffixes1'}{'en'}} = {
136             'e' => 0.215404374479001,
137             's' => 0.132237858461954,
138             't' => 0.108556117299251,
139             'n' => 0.106317393879892,
140             'd' => 0.0817062542623275,
141             'y' => 0.05929110710068,
142             'r' => 0.0555547323335896,
143             'o' => 0.050068800297187,
144             'f' => 0.0418268934210513,
145             'l' => 0.0381420370332719,
146             'g' => 0.0295515626609949,
147             'h' => 0.0229155129593708,
148             'm' => 0.0123532113869747,
149             'w' => 0.00823484248298601,
150             'k' => 0.00724565513975954,
151             'a' => 0.00670617672630508,
152             'p' => 0.00497832954325769,
153             'c' => 0.00488890466411912,
154             'u' => 0.00275356260792584,
155             'U' => 0.00255799952927019,
156             };
157              
158             ${Lingua::Identify::languages{'suffixes2'}{'en'}} = {
159             'he' => 0.0984437952904326,
160             'nd' => 0.0455569533233677,
161             'on' => 0.0413252538944018,
162             'ng' => 0.0365448447544843,
163             'es' => 0.0350476171540616,
164             'ed' => 0.0348031938838425,
165             're' => 0.028900080156137,
166             'nt' => 0.0282508781192332,
167             'at' => 0.0280336850276592,
168             'er' => 0.0279316799140045,
169             'al' => 0.0239294919907616,
170             'ly' => 0.019966420435255,
171             've' => 0.019406472872799,
172             'an' => 0.0184045751886824,
173             'ts' => 0.0180425867027258,
174             'or' => 0.0179098936099631,
175             'll' => 0.0156525982452959,
176             'se' => 0.0155363297047319,
177             'is' => 0.0153794320087292,
178             'en' => 0.0151929268962632,
179             };
180              
181             ${Lingua::Identify::languages{'suffixes3'}{'en'}} = {
182             'ion' => 0.04985545391476,
183             'ing' => 0.0456096182867606,
184             'hat' => 0.0352148880322135,
185             'ent' => 0.029132938054743,
186             'his' => 0.0174090418189491,
187             'ons' => 0.0131014111302631,
188             'ies' => 0.0125438251428653,
189             'ave' => 0.0123976340502228,
190             'uld' => 0.0120703490991796,
191             'ted' => 0.0116140383501291,
192             'ean' => 0.011505038729196,
193             'ith' => 0.0113179370176731,
194             'ity' => 0.0110924994814651,
195             'ill' => 0.010091476715993,
196             'ate' => 0.00951472281625267,
197             'nce' => 0.00930273142750881,
198             'ere' => 0.00927040345594599,
199             'ive' => 0.00909102612700888,
200             'ich' => 0.00847393378487594,
201             'ers' => 0.00840727522404286,
202             };
203              
204             ${Lingua::Identify::languages{'suffixes4'}{'en'}} = {
205             'tion' => 0.043447396134284,
206             'ment' => 0.0215948509592771,
207             'ions' => 0.0163236609077118,
208             'ould' => 0.0159641755847407,
209             'pean' => 0.0142515118249859,
210             'sion' => 0.0135945996979566,
211             'ting' => 0.0117653870124386,
212             'hich' => 0.0110664718634622,
213             'port' => 0.00964518041811549,
214             'ther' => 0.00915779400128734,
215             'mber' => 0.00844487784499523,
216             'tive' => 0.00838395454289171,
217             'dent' => 0.00814896466334956,
218             'here' => 0.00805549847937708,
219             'ents' => 0.00732820291016613,
220             'ates' => 0.00726538758004698,
221             'ally' => 0.00695395976867309,
222             'onal' => 0.00681130085629404,
223             'ding' => 0.00676854102314064,
224             'nion' => 0.00676135131668122,
225             };
226              
227             ${Lingua::Identify::languages{'smallwords'}{'en'}} = {
228             'the' => 0.0701104399345048,
229             'of' => 0.0365143240841526,
230             'to' => 0.0329557853898738,
231             'and' => 0.0291434460137306,
232             'in' => 0.0219181203028555,
233             'that' => 0.016723699654538,
234             'is' => 0.0164339272224879,
235             'a' => 0.016432928007205,
236             'for' => 0.0114395161666371,
237             'I' => 0.0104373032378572,
238             'on' => 0.0102784280078712,
239             'we' => 0.00844420182017056,
240             'be' => 0.00829931560414554,
241             'this' => 0.00787215107069248,
242             'are' => 0.00718569017131879,
243             'have' => 0.0068547833767881,
244             'not' => 0.00631154333463453,
245             'with' => 0.00629389053130275,
246             'it' => 0.00629355745954177,
247             'as' => 0.00627990151734171,
248             };
249              
250             ${Lingua::Identify::languages{'ngrams2'}{'en'}} = {
251             'th' => 0.03703516235931,
252             'he' => 0.0267079310015489,
253             'in' => 0.0232758790998718,
254             'on' => 0.0209117191924824,
255             're' => 0.0204802324630988,
256             'an' => 0.0193096875162346,
257             'at' => 0.0169485835248338,
258             'er' => 0.0164712580556205,
259             'en' => 0.0159675914514064,
260             'ti' => 0.0155715275228491,
261             'es' => 0.0141409284294576,
262             'is' => 0.0141209143317854,
263             'or' => 0.0128245603365433,
264             'nt' => 0.0125308050320004,
265             'it' => 0.0123146527771411,
266             'nd' => 0.0121674523168427,
267             'io' => 0.0115121520220932,
268             'te' => 0.0112026006447638,
269             'al' => 0.0111979522091755,
270             'to' => 0.011073348310765,
271             'ha' => 0.011031899760102,
272             'ar' => 0.0103330849433168,
273             'co' => 0.0103291682059229,
274             'of' => 0.0099566477427993,
275             'st' => 0.00978159971004092,
276             'me' => 0.00974768334667391,
277             'ou' => 0.00941058568437647,
278             'ro' => 0.0093723652139832,
279             've' => 0.00902717583047638,
280             'ng' => 0.00892181129047329,
281             'ed' => 0.008262292970838,
282             'se' => 0.00817233713398896,
283             'ur' => 0.00785120770875898,
284             'ea' => 0.00773077879416396,
285             'de' => 0.00769307481661384,
286             'le' => 0.00747657823319247,
287             'si' => 0.00714098700835423,
288             'as' => 0.00694433235832397,
289             'li' => 0.00681077591729882,
290             'pr' => 0.00667171021928005,
291             'be' => 0.0066523847787321,
292             'ic' => 0.00665079225913238,
293             'hi' => 0.00650221448458555,
294             'ri' => 0.00644656238073588,
295             'om' => 0.00637855748972082,
296             'ra' => 0.00628455579226709,
297             'pe' => 0.0062696635819562,
298             'ta' => 0.00616214698843999,
299             'ne' => 0.00585397292535908,
300             'ce' => 0.00577344308289757,
301             };
302              
303             ${Lingua::Identify::languages{'ngrams3'}{'en'}} = {
304             'the' => 0.0321360337359075,
305             'ion' => 0.0141982845176282,
306             'and' => 0.0114744542298976,
307             'ent' => 0.00983327117817493,
308             'ing' => 0.00980854298746378,
309             'tio' => 0.00970664677701598,
310             'hat' => 0.00711385868785679,
311             'tha' => 0.00707341002323647,
312             'ati' => 0.00687288791990591,
313             'for' => 0.00643827992770877,
314             'men' => 0.00600200808973292,
315             'res' => 0.00511339969591784,
316             'com' => 0.00486606041481396,
317             'pro' => 0.00473823115981526,
318             'thi' => 0.00473662468802892,
319             'ate' => 0.00473582145213575,
320             'con' => 0.00442410855159356,
321             'ons' => 0.00414056628130468,
322             'ope' => 0.00407114375053788,
323             'her' => 0.00394245388565363,
324             'rop' => 0.00387658854241372,
325             'his' => 0.00378169195903497,
326             'ort' => 0.00370658940302361,
327             'are' => 0.00364628933704352,
328             'ter' => 0.00357543245646748,
329             'eur' => 0.00350170687627299,
330             'all' => 0.00339625347829829,
331             'ere' => 0.00335574743968559,
332             'iti' => 0.00318173212082963,
333             'por' => 0.0031745029977911,
334             'ver' => 0.00312699733210935,
335             'uro' => 0.00311747324937606,
336             'eve' => 0.00311471929774233,
337             'rea' => 0.00309205657075648,
338             'ect' => 0.0030688774778393,
339             'sta' => 0.00303485470036432,
340             'ssi' => 0.00297662009810953,
341             'omm' => 0.0029169511460455,
342             'pre' => 0.00290759918528931,
343             'nce' => 0.00290461573768611,
344             'sio' => 0.00290163229008291,
345             'ive' => 0.00288912475974641,
346             'not' => 0.00285642158409593,
347             'ith' => 0.00284529102957629,
348             'our' => 0.00280237528328409,
349             'wit' => 0.00276932786367939,
350             'ide' => 0.00275515648756419,
351             'cti' => 0.00270707708195875,
352             'pea' => 0.00267150520668981,
353             'ean' => 0.00262434378496228,
354             };
355              
356             ${Lingua::Identify::languages{'ngrams4'}{'en'}} = {
357             'tion' => 0.0131262038250589,
358             'that' => 0.00865535572298238,
359             'atio' => 0.0072651281658744,
360             'ment' => 0.00678617567527459,
361             'this' => 0.00475554833499181,
362             'euro' => 0.00423855770627684,
363             'port' => 0.00420825216708037,
364             'rope' => 0.00419778582106922,
365             'ther' => 0.00405555286520127,
366             'urop' => 0.00405531854402192,
367             'comm' => 0.00396596406762822,
368             'sion' => 0.0039461248744429,
369             'with' => 0.00371625579749651,
370             'ions' => 0.00342108921857011,
371             'ould' => 0.00330463159243111,
372             'have' => 0.00326932720140843,
373             'opea' => 0.00301524493592878,
374             'pean' => 0.00301516682886899,
375             'pres' => 0.00290159916394203,
376             'ssio' => 0.00276311534694375,
377             'ommi' => 0.00276264670458504,
378             'here' => 0.00272546774412752,
379             'ting' => 0.00248895956709943,
380             'coun' => 0.00247802457872957,
381             'will' => 0.00246740201859885,
382             'side' => 0.00244412611478301,
383             'tive' => 0.00235188167717727,
384             'miss' => 0.00233407326754636,
385             'issi' => 0.00232063885326339,
386             'hich' => 0.00228681849637661,
387             'whic' => 0.00228556878342006,
388             'emen' => 0.00225424785244639,
389             'iden' => 0.00216364366309613,
390             'mber' => 0.00214005533104115,
391             'mmis' => 0.00201750535423895,
392             'stat' => 0.00200696090116801,
393             'dent' => 0.00192666684370934,
394             'resi' => 0.00188706656439849,
395             'ight' => 0.00187847478782217,
396             'esid' => 0.00187097651008284,
397             'tate' => 0.00185582374048461,
398             'amen' => 0.00185426159928891,
399             'inte' => 0.00184317039679949,
400             'ecti' => 0.00183606265435908,
401             'ctio' => 0.00182668980718491,
402             'embe' => 0.00182356552479352,
403             'rati' => 0.00174569278618817,
404             'ount' => 0.00168469117249632,
405             'memb' => 0.00167313132764818,
406             'part' => 0.00162150256113049,
407             };
408              
409             ${Lingua::Identify::languages{'letters'}{'en'}} = {
410             'e' => 0.12589089351882,
411             't' => 0.0989762658090339,
412             'o' => 0.0802197808213591,
413             'i' => 0.0800499385536405,
414             'a' => 0.0775778166016916,
415             'n' => 0.0745558628120638,
416             's' => 0.0644019707998579,
417             'r' => 0.06316479784288,
418             'h' => 0.0453599633053112,
419             'l' => 0.0389057860580027,
420             'c' => 0.0327976572989509,
421             'd' => 0.0320229315801852,
422             'u' => 0.0298258281914761,
423             'm' => 0.0279955758894873,
424             'p' => 0.0247245041402987,
425             'f' => 0.0213395313215624,
426             'g' => 0.0178665238221572,
427             'w' => 0.0157363103676524,
428             'y' => 0.0143180726885217,
429             'b' => 0.0137603030172185,
430             'v' => 0.0107902530793491,
431             'k' => 0.00515220145893276,
432             'x' => 0.00172124394885599,
433             'j' => 0.00118318200241296,
434             'q' => 0.000982888562601348,
435             'z' => 0.00051157969116216,
436             'é' => 2.55584556780453e-05,
437             'á' => 1.85786364567317e-05,
438             'ö' => 1.38227792422092e-05,
439             'ü' => 1.26252612385525e-05,
440             'ä' => 1.19409652364629e-05,
441             'ó' => 1.00249364306121e-05,
442             'í' => 9.58014402925393e-06,
443             'š' => 8.93006282726884e-06,
444             'è' => 4.20842041285083e-06,
445             'č' => 4.20842041285083e-06,
446             'ń' => 3.45569481055231e-06,
447             'ε' => 3.147761609612e-06,
448             'à' => 3.11354680950753e-06,
449             'ç' => 2.77139880846274e-06,
450             'ß' => 2.63453960804483e-06,
451             'ł' => 2.60032480794035e-06,
452             'ć' => 2.08710280637318e-06,
453             'ú' => 1.98445840605974e-06,
454             'ι' => 1.60809560491048e-06,
455             'ø' => 1.53966600470152e-06,
456             'ã' => 1.50545120459705e-06,
457             'ė' => 1.47123640449257e-06,
458             'ľ' => 1.30016240397018e-06,
459             'ï' => 1.2659476038657e-06,
460             'ý' => 1.23173280376122e-06,
461             'ê' => 1.12908840344778e-06,
462             'ν' => 1.06065880323883e-06,
463             'ñ' => 1.06065880323883e-06,
464             'τ' => 9.58014402925393e-07,
465             'α' => 9.58014402925393e-07,
466             'ô' => 9.58014402925393e-07,
467             'ž' => 8.89584802716436e-07,
468             'ο' => 8.2115520250748e-07,
469             'ă' => 7.18510802194045e-07,
470             'ő' => 6.1586640188061e-07,
471             'ş' => 5.81651601776131e-07,
472             'μ' => 5.47436801671653e-07,
473             'ţ' => 5.47436801671653e-07,
474             'ğ' => 5.13222001567175e-07,
475             'ū' => 4.44792401358218e-07,
476             'β' => 4.1057760125374e-07,
477             'µ' => 3.76362801149261e-07,
478             'å' => 3.76362801149261e-07,
479             'ë' => 3.07933200940305e-07,
480             'ś' => 3.07933200940305e-07,
481             'õ' => 2.73718400835827e-07,
482             'а' => 2.0528880062687e-07,
483             'ı' => 1.71074000522392e-07,
484             'ę' => 1.36859200417913e-07,
485             'е' => 1.36859200417913e-07,
486             'д' => 1.36859200417913e-07,
487             'ť' => 1.36859200417913e-07,
488             'κ' => 1.02644400313435e-07,
489             'о' => 1.02644400313435e-07,
490             'ň' => 1.02644400313435e-07,
491             'ż' => 1.02644400313435e-07,
492             'и' => 1.02644400313435e-07,
493             'œ' => 1.02644400313435e-07,
494             'ķ' => 1.02644400313435e-07,
495             'ř' => 1.02644400313435e-07,
496             'ź' => 1.02644400313435e-07,
497             'б' => 6.84296002089566e-08,
498             'ų' => 6.84296002089566e-08,
499             'н' => 6.84296002089566e-08,
500             'î' => 6.84296002089566e-08,
501             'м' => 6.84296002089566e-08,
502             'р' => 6.84296002089566e-08,
503             'â' => 6.84296002089566e-08,
504             'û' => 6.84296002089566e-08,
505             'δ' => 6.84296002089566e-08,
506             'ą' => 6.84296002089566e-08,
507             'з' => 6.84296002089566e-08,
508             'đ' => 6.84296002089566e-08,
509             'с' => 3.42148001044783e-08,
510             'η' => 3.42148001044783e-08,
511             'в' => 3.42148001044783e-08,
512             'ω' => 3.42148001044783e-08,
513             'χ' => 3.42148001044783e-08,
514             'ъ' => 3.42148001044783e-08,
515             'г' => 3.42148001044783e-08,
516             'ρ' => 3.42148001044783e-08,
517             'ů' => 3.42148001044783e-08,
518             'ά' => 3.42148001044783e-08,
519             'ù' => 3.42148001044783e-08,
520             'ί' => 3.42148001044783e-08,
521             'я' => 3.42148001044783e-08,
522             'ǔ' => 3.42148001044783e-08,
523             'л' => 3.42148001044783e-08,
524             'ή' => 3.42148001044783e-08,
525             'т' => 3.42148001044783e-08,
526             'ш' => 3.42148001044783e-08,
527             };