CESIRE

ARC

Correus periòdics

Subscriure'm



Joomla : CESIRE - CREAMAT

Àmbits CESIRE

aulatec
cesire cdec
cesire cirel

 

Portals

mmaca
 
Edu 365
Image

 

Lletres, paraules, frases... (proposta 9 - abril 2013)

L’estadística es fa servir relacionada amb la llengua de moltes formes. Un dels exemples més clars és el de la desencriptació de missatges codificats. Un altre de ben conegut és del reconeixement d’autories de textos. La proposta d’aquesta setmana gira al voltant de les lletres, els mots i les frases.

 

  • Missatges secrets

A cada llengua hi ha una lletres que apareixen més que altres. En català, per exemple, les lletres més utilitzades són, per ordre: E, A, S, I, R... Si ens trobem un missatge codificat és possible que el signe que més es repeteixi es correspongui amb la E o la A. Analitzant l’estadística dels signes o lletres apareguts en el missatge codificat i comparant-la amb la de presència en el català podem arribar a descodificar un missatge encriptat.

Podeu fer una prova de desencriptar aquest text o el botó “estadístiques de les lletres” us pot servir de pista.

Us proposem repartir en diferents grups quatre fragments codificats de forma lleugerament diferent, que junts formen un text complet i que es descodifiqui utilitzant eines estadístiques.

 

Missatge 1

UV UMHVM GAM HRTMQM, ZBYF MHMAPMF WM RY ERTYR JJV, GA OVDGDTVM ARGDBYRT ÇGR UMHVM VAHRAFMF GAM ZRDMHRYYBEM FROAVOM, FBFMYZRAF ERTGDM, CRD FDMECYMAFMD ORDHRYYE, QR FMY ZMARDM ÇGR CBQVM OMAHVMD RY ORDHRYY M GAM CRDEBAM CRD ÇGMYERHBY MYFDR FVCGE QR ORDHRYY ÇGR QREVFTRE. YBTVOMZRAF, V RA NBAM ROBABZVM QR ZRDOMF, RYE QVHRDEBE FVCGE QR ORDHRYY RA BSRDFM FRAVRA FMZNR QVSRDRAFE CDRGE. GA NBA QVM ER YV HM CDRERAFMD, MY OVDGDTVM, GA OYVRAF V YV HM QRZMAMD ÇGR YV OMAHVRE RY ORDHRYY.

Missatge 2

-"QSPX EI", ZD HMV IP QIXKI, "UYMR XMTYW HI FIVZIPP PM DKVDHDVMD XIRMV D ZSWXI? IR XIRMQ HI HMZIVWSW TVIYW. TIV IBIQTPI, IP FIVZIPP H'YR DHZSFDX PM FSWXDVMD D 6 IYVSW IPW FIRX KVDQW, QIRXVI UYI IP H'YR NYXKI D 30 IYVSW IPW FIRX KVDQW, M DMBM ZDR TYNDRX IPW TVIYW" -"SL, RS!, DUYIWXW XMTYW HI FIVZIPPW RS Q'DKVDHIR KIRW", ZD FSRXIWXDV IP TDFMIRX, "IP UYI Q'DKVDHDVMD IW XIRMV IP FIVZIPP H'YR TVSJIWWSV".

Missatge 3

-"¡PX, ZP UÇIUÇR: P KDHIU BY PWGPTUÇ BUH RDHUH RPGUH!", KP GUEBYRPG UB RYGJGWYP, "KUJGP, UB RUGKUBB T'JÇ EGDVUHHDG TU BBUÇWJP Y BYIUGPIJGP BY KYÇTGP P RDHIPG P GPD TU 60000 UJGDH UBH RUÇI WGPCH: UÇ RPÇKY, UBH RUGKUBBH TUBH EGDVUHHDGH T'XYHIDGYP UHIPÇ ZP P 120000 UJGDH UBH RUÇI WGPCH. PYMY FJU, TYWJY'C FJYÇ IYEJH TU RUGKUBB TU EGDVUHHDG TUHYIZPGYP KDHIU FJU BY EDHUH". -"C'PWGPTPGYP UB RUGKUBB T'JÇ EGDVUHHDG TU CPIUCPIYFJUH", KP PVYGCPG UB EPRYUÇI. "KPZP, KPZP!, KUYW FJU BY PWGPTUÇ P KDHIU BUH RDHUH GUPBCUÇI UMFJYHYTUH Y RPGYHHYCUH", KP TYG UB CUIWU, "PFJUHIH HDÇ UBH RUGKUBBH CUH RPGH TU IDIH: UHIPÇ P 600000 UJGDH UBH RUÇI WGPCH".

Missatge 4

-"MA QVJZMQITM!", ÇH ZMXTQJHZ MT XHJQMVB, "XMZ YCM PHV LM AMZ BHV JHZA? AQ MT JMZÇMTT L'CV IWV HLÇWJHB VWUMA JWABH H 6 MCZWA MTA JMVB OZHUA Q MT L'CV PWVWZHITM RCBOM ÇH H 30 MCZWA MTA JMVB OZHUA, XMZ YCM PH LM JWABHZ H 600000 MCZWA MTA JMVB OZHUA MT JMZÇMTT L'CV XZWNMAAWZ LM UHBMUHBQYCMA?" -"WP!, HQEW BM CVH MEXTQJHJQW UWTB AMVGQTTH Q PW MVBMVLZH ÇWABM LM AMOCQLH", ÇH LQZ MT UMBOM, ”A’HLWVH ÇWABM LM TH YCHVBQBHB LM UHBMUHBQJA YCM MA VMJMAAQBMV XMZ ZMCVQZ BHV AWTA JMVB OZHUA LM JMZÇMTT?”

Un model de procés per fer-ho a l’aula pot ser el següent:

  • Recol·lecció de dades: si no es vol donar feta l’estadística de freqüències en català es pot fer que, per parelles, facin un recompte de lletres d’una pàgina d’un llibre. Després es poden ajuntar les dades de tota la classe i calcular les freqüències relatives de cada lletra. També caldrà calcular les freqüències absolutes i relatives del text a descodificar. Si donem el text en format digital podem utilitzar eines de recompte ràpid com la que podeu trobar en aquest enllaç.

Si ens estimem més donar feta la taula de freqüència a continuació en teniu una:

  • Descodificació del text: a més de la comparació estadística es poden fer servir turcs lingüístics com buscar les paraules d’una sola lletra, de dues, de tres... els dígrafs, els apòstrofs, els plurals... Si el text s’ha donat en format digital es pot treballar amb un processador de textos i les eines cercar i reemplaçar. Convé que les lletres “clares” (les decodificades) estiguin en minúscula i les codificades amb majúscula.

L’activitat es pot completar proposant formes de complicar la codificació que dificultin la desencriptació o investigant mètodes històrics existents d’encriptar missatges. Podeu trobar una activitat relaciona, Missatges secrets, en el web Calaix +ie.

  • Adaptació a cicle inicial

Es poden buscar quines són les vocals més usuals als noms dels nens i nenes o les consonants que surten més. Es pot utilitzar fent un joc semblant al “penjat” per endevinar noms en els que només es donen una part de les lletres i s’han de completar. Aquesta variació pot fer veure que unes lletres apareixen més que d’altres.

 

  • Autors anònims

Aquesta activitat de Victòria Oliu la podeu trobar a l’ARC. Bàsicament consisteix en estudiar la longitud mitjana de les paraules i de la llargada mitjana dels fragments entre punts de dos autors i utilitzar les dades recollides per identificar a quin d’aquests d'ells correspon un tercer text anònim. A la fitxa de l’ARC hi trobareu el material necessari per a dur a terme l’activitat.

  • Investigar la llei de Zipf

La llei de Zipf  proposada pel lingüista Kingsley Zipf afirma que cada llengua té una constant que relaciona, amb proporció inversa, el rang que té una paraula en una llengua amb la freqüència que apareix. Així si “la” és la segona paraula (rang 2) que més apareix en català i multipliquem aquest número per la seva freqüència d’aparició obtindrem un resultat similar al de multiplicar 4, que és el rang de “el”, per la seva freqüència.

Per comprovar la veracitat de la llei convé utilitzar textos llargs o ajuntar dades des de tota la classe amb textos més curts. Amb un processador de textos. i l’eina reemplaça, que ens informa de la quantitat de reemplaços fets, es pot alleugerir el recompte de cada paraula.

  • Fórmules de llegibilitat

Existeixen diferents fórmules que ens informen sobre la facilitat de lectura que té un text. La majoria relacionen longituds de paraules i de frases. A continuació teniu un parell que es oden treballar a l'aula comparant diferents textos (per autoria o per tipologia).


 

AddThis Social Bookmark Button