cerca

martedì 12 ottobre 2010

lessici di frequenza

STOLIDITA DEI LESSICI DI FREQUENZA

Leggendo romanzi e periodici e ascoltando commedie e dialoghi di film incontrerete in media il sostantivo “cosa ogni 250 parole, e una parola su otto sarà un articolo determinativo. La particella rafforzativa-negativa “mica”comparirà con una frequenza doppia rispetto, per esempio, all’avverbio “spesso” o al sostantivo “lettera” o alle voci del verbo telefonare”. Tra le prime cento parole usate con più frequenza nell’italiano medio scritto troverete 8 sostantivi: dopo “cosa”, in ordine descrescente, “giorno”, “anno”, “casa”, “uomo”, tempo”, “vita” e “parte”); 20 verbi (che diventano 22 se “essere” e “avere” sono considerati in senso proprio e come ausiliari) tra i quali “parlare” e “pensare”; e molti avverbi, pronomi, preposizioni e congiunzioni (tra cui le meravigliose “se”, “ma”, “che”: senza le quali, dopo la “e”, addio possibilità di discorso).

A che cosa servono queste ricerche quantitative sulla lingua? Forse a orientare sull’insegnamento di base dell’italiano nelle scuole elementari e agli stranieri; dico a orientare e non di più, perché le voci schedate nel “Lessico di frequenza della lingua italiana” da Bortolini, Tagliavini e Zampolli (pubblicato da Garzanti dopo l’edizione fuori commercio della IBM) non sono state ricavate, neppure parzialmente, dal parlato.

Gli autori hanno predisposto lo spoglio elettronico di 500.000 voci traendole da 10 copioni teatrali e 8 cinematografici, 10 romanzi di stile ‘medio’, 6 periodici e 3 sussidiari per le classi elementari: tutti testi datati tra il ‘47 e il 68. Hanno quindi scelto, per includerle nel Lessico le prime 5.356 voci risultanti da un calcolo che teneva conto non solo della frequenza in assoluto, ma anche di un certo rapporto tra questa e la distribuzione nei cinque settori prescelti (teatro, cinema, romanzi, periodici, sussidiari). Sicché, per esemplificare, una parola come “divinità” registrata 15 volte ma in un solo settore (nei sussidiari) è stata esclusa, mentre è inclusa, sia pure tra gli ultimi posti, la parola “intermediario” che compare 3 volte equamente distribuita in tre settori (a quota 15 è anche la voce «poliziotto» che con mirabile giustizia distributiva si è fatta registrare 3 volte in ogni settore).

Sfogliando il Lessico con qualche attenzione si affollano osservazioni curiose e altre prevedibili. Mancano “allegramente”, “collera”, “indifferenza”, “percorrere”, “pranzare”, “tuono”, “vuotare”, tutte voci presenti nel recentissimo “Dizionario del francese fondamentale” (Zanichelli) che Raoul Bloch ha ricavato con poche modifiche dalle circa 3.500 voci del Francais fondamentale (costruito sulla lingua parlata). Non c’è “raffreddore” (che i francesi non si son lasciati scappare) ma c’è “singhiozzo”. C’è “sindaco”, ma non “sindacato”. Si va in “tram” e in “corriera”, mai in “autobus” o in “filobus”. Il caso maligno ha voluto includere tra le 5.356 parole più frequenti la voce “podestà” (che compariva, manco a dirlo, 5 volte nei sussidiari e s’è fatta scovare 2 volte in un romanzo, probabilmente nelle Cronache di poveri amanti di Pratolini) e ha tenuto fuori “federale”, “vassallo”, “governatore”, “duca” e altre simili ugualmente necessarie alla conoscenza della storia. La “frittata” (3) ce l’ha fatta per un pelo; meglio “carota”, uniformemente distribuita una volta per settore.

Il sostantivo “sesso” e l’aggettivo “sessuale” ricorrono con moderata frequenza (15 e 13), soprattutto nei giornali o periodici. Le voci più ardite, tanto per dire, accolte

nel Lessico sono: “puttana” (al cinema 18 volte su 25), “battona” (al teatro e al cinema, mai nei romanzi) e “prostituta”; peraltro mancano “ruffiano”, “lenone”, “magnaccia, e la voce “protettore” compare soprattutto (4 su 7) nei sussidiari: è dunque lecito supporre in altra accezione. Non c’è “mafia”, né “spaghetti” né “maccheroni”, né “pizza”, e “pastasciutta” compare soltanto 5 volte. Non deduciamone alcuna conclusione, per carità.

La prosa dei romanzi schedati — che vanno da Vittorini a Moravia a Calvino a Bevilacqua — è definita dagli autori del Lessico con molta approssimazione, “neorealistica”. Ora, è qui che si scoprono le più allegre cattiverie dell’impassibile calcolatore elettronico. Tutti nominano il “suicidio”, perfino i sussidiari, ma non i romanzi neorealisti; che accennano appena 2 volte al “prosciutto” e mai alla “bistecca”. In questi romanzi si va molto in “bicicletta”(14 su 24), rare le “motociclette” (5 su 24). Pensavo la voce “cagnolino” inflazionata dai sussidiari; e invece no: essi usano soltanto “cane”; sono i romanzi neorealisti ad accaparrarsi “cagnolino” 24 volte su 29.

Il sentimento più diffuso al teatro, al cinema e nei romanzi non è la tristezza, la malinconia, la tenerezza o l’”allegria” (15): è la “paura” (204). Di “soldi” si parla soprattutto al cinema e al teatro, il “sole” splende o tramonta per lo più nei romanzi. Di “giornalisti” parlano frequentemente i giornali (19 su 25), il “blu” si trova in prevalenza nei libri di scuola (oltre che nei terrificanti romanzi di William Burroughs, ma questo non c’entra). A parziale compenso delle pur utili parole assenti (come “edile”, “metalmeccanico”, “idraulico ., “gomito”, “ruga” e “berretto”), dirò che il Lessico è stato si costretto a registrare “chic” e “smoking”, ma anche certi aggettivi ormai da considerare squisiti, come “estatico”, “mansueto” e “stento”.

Non ho ben capito a che cosa serva un lessico di frequenza, se lo si può toccare soltanto con le molle. Però, maneggiato così, si può dir tutto meno che non è divertente.

Giuliani A., “Le droghe di Marsiglia”, Adelphi, pag. 282

Nessun commento:

Posta un commento