jeudi 1 mai 2008
Les mots les plus fréquents sur le RSS de l'Assemblée Nationale
Par lucas, jeudi 1 mai 2008 à 21:23 :: Lois pourries
Merci Hpricot :) . En virant les mots un peu inutiles car n'apportant pas d'information, sachant que "de" est le grand gagnant, avec une fréquence de cinq pourcents (mais je n'ai pas fais la somme des le/la/l' qui doivent se valoir). Les mots les plus utilisés ces derniers temps à l'Assemblée Nationale sont (suivis de leur fréquence, et sans tri):
--- - - "ADOPT\xC9"
- 0.000682860208760121
- - "ASSEMBL\xC9E"
- 0.000780411667154424
- - NATIONALE
- 0.000780411667154424
- - relatif
- 0.000585308750365818
- - lutte
- 0.000877963125548727
- - contre
- 0.00117061750073164
- - produits
- 0.000682860208760121
- - "Assembl\xE9e"
- 0.000682860208760121
- - nationale
- 0.00097551458394303
- - projet
- 0.000780411667154424
- - loi
- 0.00351185250219491
- - article
- 0.0130718954248366
- - code
- 0.00614574187884109
- - "r\xE9dig\xE9"
- 0.00282899229343479
- - application
- 0.00136572041752024
- - usage
- 0.000682860208760121
- - personnel
- 0.000780411667154424
- - notamment
- 0.000585308750365818
- - substances
- 0.00136572041752024
- - "proc\xE9d\xE9s"
- 0.00146327187591454
- - "mentionn\xE9s"
- 0.00146327187591454
- - conditions
- 0.00302409521022339
- - lorsque
- 0.000585308750365818
- - "pr\xE9sent"
- 0.00097551458394303
- - convention
- 0.00107306604233733
- - dopage
- 0.000877963125548727
- - Paris
- 0.000682860208760121
- - accord
- 0.00146327187591454
- - personne
- 0.00165837479270315
- - moyen
- 0.000585308750365818
- - "contr\xF4le"
- 0.000585308750365818
- - "pr\xE9vues"
- 0.00136572041752024
- - titre
- 0.00214613208467467
- - dernier
- 0.00136572041752024
- - "alin\xE9a"
- 0.00380450687737782
- - "modifi\xE9"
- 0.00146327187591454
- - "Apr\xE8s"
- 0.000682860208760121
- - "premi\xE8re"
- 0.00107306604233733
- - phrase
- 0.00107306604233733
- - "ins\xE9r\xE9"
- 0.000682860208760121
- - "r\xE9dig\xE9e"
- 0.000585308750365818
- - "d\xE9lai"
- 0.0031216466686177
- - "deuxi\xE8me"
- 0.00126816895912594
- - "apr\xE8s"
- 0.00204858062628036
- - mot
- 0.00126816895912594
- - "ins\xE9r\xE9s"
- 0.00107306604233733
- - mots
- 0.00409716125256073
- - sous
- 0.00097551458394303
- - peine
- 0.000682860208760121
- - "remplac\xE9s"
- 0.00156082333430885
- - "op\xE9rations"
- 0.000682860208760121
- - "acc\xE8s"
- 0.000780411667154424
- - judiciaire
- 0.000585308750365818
- - agents
- 0.00097551458394303
- - relevant
- 0.000585308750365818
- - "charg\xE9"
- 0.000780411667154424
- - personnes
- 0.00136572041752024
- - peuvent
- 0.00117061750073164
- - documents
- 0.0034143010438006
- - dispositions
- 0.00253633791825188
- - chapitre
- 0.00156082333430885
- - autorisation
- 0.000585308750365818
- - ordonnance
- 0.00165837479270315
- - "\xE9l\xE9ments"
- 0.000585308750365818
- - demande
- 0.00097551458394303
- - publique
- 0.00126816895912594
- - "autorit\xE9"
- 0.000877963125548727
- - date
- 0.00224368354306897
- - livre
- 0.00146327187591454
- - "int\xE9ress\xE9"
- 0.000585308750365818
- - suivant
- 0.000682860208760121
- - lorsqu&
- 0.000585308750365818
- - premier
- 0.00136572041752024
- - punie
- 0.000682860208760121
- - ans
- 0.00224368354306897
- - emprisonnement
- 0.00107306604233733
- - amende
- 0.00107306604233733
- - "r\xE9f\xE9rence"
- 0.00146327187591454
- - "r\xE9f\xE9rences"
- 0.000585308750365818
- - articles
- 0.00146327187591454
- - "compl\xE9t\xE9"
- 0.000780411667154424
- - "pr\xE9sente"
- 0.00156082333430885
- - section
- 0.00126816895912594
- - partie
- 0.00156082333430885
- - "mati\xE8re"
- 0.000682860208760121
- - Gouvernement
- 0.000682860208760121
- - compter
- 0.00175592625109745
- - publication
- 0.00117061750073164
- - droit
- 0.00107306604233733
- - Parlement
- 0.000682860208760121
- - Conseil
- 0.00097551458394303
- - entre
- 0.000780411667154424
- - juillet
- 0.000682860208760121
- - portant
- 0.000877963125548727
- - devant
- 0.000585308750365818
- - jour
- 0.000585308750365818
- - archives
- 0.00380450687737782
- - patrimoine
- 0.000585308750365818
- - publiques
- 0.00107306604233733
- - "collectivit\xE9s"
- 0.000585308750365818
- - territoriales
- 0.000585308750365818
- - Conforme
- 0.000585308750365818
- - issue
- 0.000585308750365818
- - service
- 0.000682860208760121
- - public
- 0.000585308750365818
- - "fix\xE9es"
- 0.000682860208760121
- - conservation
- 0.000780411667154424
- - "s\xE9curit\xE9"
- 0.000585308750365818
- - communication
- 0.00117061750073164
- - contrat
- 0.00370695541898351
- - contrats
- 0.00117061750073164
- - document
- 0.000780411667154424
- - porte
- 0.000682860208760121
- - atteinte
- 0.000682860208760121
- - secret
- 0.00107306604233733
- - cause
- 0.000585308750365818
- - parties
- 0.000877963125548727
- - "r\xE9serve"
- 0.000585308750365818
- - travail
- 0.00487757291971515
- - "dur\xE9e"
- 0.00214613208467467
- - "ind\xE9termin\xE9e"
- 0.000585308750365818
- - entreprise
- 0.00126816895912594
- - employeur
- 0.00126816895912594
- - appel
- 0.000585308750365818
- - "ann\xE9e"
- 0.000780411667154424
- - "d\xE9termin\xE9e"
- 0.000877963125548727
- - conclus
- 0.000585308750365818
- - "p\xE9riode"
- 0.00136572041752024
- - essai
- 0.00117061750073164
- - "salari\xE9"
- 0.00214613208467467
- - branche
- 0.000780411667154424
- - "dur\xE9es"
- 0.000585308750365818
- - "indemnit\xE9"
- 0.000682860208760121
- - rupture
- 0.00185347770949176
- - conventionnelle
- 0.000877963125548727
- - homologation
- 0.000682860208760121
- - portage
- 0.000585308750365818
Mon code était en premier jet, c'est perfectible et ce sera amélioré par la suite (il faudra sans doute rajouter un stemmer-like pour les pluriels). Les caractères bizarres font suite à un soucis d'encodage avec le langage Ruby, mais ce sont des caractères accentués, je n'ai pas pris la peine de corriger cela. On remarquera que les dopage, l'emploi et les archives ont été à l'honneur cette semaine.