GUIDA ALLA CONSULTAZIONE

Giuseppe Savoca aveva individuato, già a metà degli anni Ottanta, quelle che sono le caratteristiche indispensabili di una concordanza:

  1. esaustività dello spoglio eseguito al computer;
  2. lemmatizzazione di tutte le occorrenze di parola;
  3. classificazione grammaticale dei lemmi;
  4. corredo di dati statistici e di liste di frequenza.

L’esaustività significa che nella concordanza sono stati registrati tutti i lemmi-base di tutte le parole del testo, mentre per i contesti sono stati soppressi quelli riguardanti le categorie grammaticali di preposizioni, articoli e congiunzioni. Pur considerata l’importanza e il peso statistico che queste categorie hanno nell’economia lessicale di un’opera (circa il 30% del lessico totale), per evitare un eccessivo appesantimento del testo si sono forniti i riferimenti del contesto solo alle categorie ‘semantiche’ (sostantivi, aggettivi, verbi, avverbi, a cui si aggiungono le esclamazioni).

I contesti sono ordinati sotto ogni lemma nella successione del testo. Se nel caso delle poesie il contesto coincide con l’unità metrica del verso, per i testi in prosa (novelle, romanzi, saggi) e per quelli teatrali si è ‘ritagliata’ una stringa nella quale la parola lemmatizzata è posta al centro (sistema KWIC, Key word in context). Il riferimento è dato da un numero che indica la stringa del testo di servizio che abbiamo utilizzato per la redazione della concordanza.

Il nostro obiettivo è stato quello di produrre, per ogni opera di Pirandello, una concordanza specifica, e al contempo rendere ognuna di esse parte di una serie complessiva, che al completamento dell’opera omnia porterà alla redazione di un Vocabolario pirandelliano, strumento indispensabile non solo per fornire innovative e originali chiavi di comprensione dell’opera, ma anche utile per ricostruire un momento importantissimo del formarsi della lingua del nostro romanzo moderno.

LA CONCORDANZA

Caratteri generali dei lemmi

Il modello di classificazione grammaticale da noi seguito è quello delle concordanze pubblicate da Giuseppe Savoca nella prestigiosa collana «Strumenti di Lessicografia Letteraria Italiana». Esso a sua volta si ispira a quello proposto dall’Opera del Vocabolario della Crusca da Piero Esperti, Grammatichetta della lingua italiana ad uso del calcolatore, all’interno del volume di S. D’Arco Avalle, Al servizio del vocabolario della lingua italiana (Firenze, Accademia della Crusca, 1979).

I lemmi, nella quasi totalità, sono formati da una sola parola, ad eccezione di locuzioni sostantivate, di alcune espressioni latine, di locuzioni avverbiali, congiuntive e preposizionali (prima di; ora che, ecc.), dei nomi propri di persona, di luoghi, monumenti, titoli di opere.

Quando una parola si presenta con varianti grafiche (movendo, muovendo), esse sono state riportate ai rispettivi lemmi (quindi movere, muovere). Fanno eccezione gli avverbi, congiunzioni e preposizioni che si presentano in forma sia unita che separata (nonché / non che, finché / fin che, nonostante / non ostante), per i quali abbiamo realizzato un doppio lemma.

I lemmi si presentano con l’iniziale maiuscola o minuscola a seconda degli usi d’autore: pertanto, quando tutte le occorrenze di un sostantivo sono maiuscole, anche il lemma è riportato in maiuscolo (es. Parlamento), mentre quando vi è un’oscillazione di maiuscola e minuscola il lemma appare in minuscolo. Inoltre, quando un lessema ricorre con accento di parola (es. brontolìo), questo viene conservato anche nel lemma, mentre quando coesistono forme accentate e non il lemma è privo di accento.

I lemmi sono ordinati alfabeticamente. L’omografia viene segnalata solo quando si tratta di forme identiche e appartenenti alla stessa categoria grammaticale, mentre non viene indicata quando: 1) i lemmi, pur identici nella forma, appartengono a categorie grammaticali diverse (es. «più» avverbio e «più» aggettivo); 2) i lemmi differiscono per l’accento (ad es. la congiunzione «che», scritta come «ché» quando ha valore causale). La distinzione dei lemmi omografi è stata fatta sulla base di una forte divaricazione, suggerita dalle sistemazioni dei dizionari, dei significati dei lemmi che si presentano graficamente identici.

In alcuni casi sono state sciolte o integrate in uno o più lemmi forme abbreviate (ad es. «c.s.», riportato a «come» e «sopra»; S.E., ricondotto a «Sua» e «Eccellenza»), oppure nomi propri presenti in forma contratta (ad es. «Co’», riportato a «Cosmo»).

Le categorie grammaticali

Aggettivi qualificativi (ag)

Rientrano in questa categoria gli aggettivi qualificativi e i loro superlativi regolari in -issimo, ricondotti nel lemma al positivo. Per i diminutivi e gli alterati sono stati creati dei lemmi distinti.

Quando l’aggettivo si trova in una forma che coincide con il participio presente o passato del verbo (es. «morto»), la determinazione del valore qualificativo o verbale è spesso arbitraria e rimessa alla decisione del concordatore. Nei casi di insicurezza tra le due attribuzioni, ci siamo rifatti alla norma della Crusca dell’in dubio pro verbo.

Vi sono dei casi in cui il lemma aggettivale è composto da due elementi, ad es. «così detto», che viene riportato staccato anche nel lemma. Le forme come «mal augurosa», «mal capitata», «mal fatto», «mal guardate», «mal proprie», ecc. sono state riportate nel lemma nella forma unita.

 

Articoli (ar)

Degli articoli sono dati singoli lemmi per tutte le forme.

 

Avverbi (av)

Gli avverbi sono normalmente costituiti da lemmi di una sola parola. Le locuzioni avverbiali sono state scomposte nei loro lemmi costitutivi (ad es. «in alto» si troverà sotto la preposizione «in» e il sostantivo «alto»; «in breve» sotto la preposizione «in» e l’aggettivo «breve»). Le occorrenze al superlativo si trovano sotto il lemma positivo.

Vi sono locuzioni avverbiali in cui i sostantivi hanno perso il significato autonomo, e pertanto non vengono considerati come lemmi separati. Per questo abbiamo lemmatizzato sotto un’unica voce locuzioni come «in disparte», registrato sotto «disparte, in», «a cavalcioni», registrato come «cavalcioni, a», «a malincuore», che si trova sotto «malincuore, a». Gli avverbi duplicati del tipo «a poco a poco» contano per ognuno dei loro elementi (due avverbi e due preposizioni il secondo).

 

Congiunzioni (co)

Le varianti di una stessa congiunzione (ad esempio «allora che» e «allorché») sono state raccolte sotto un unico lemma a due membri. Se la congiunzione appare solo nella forma separata, questa viene assunta anche nel lemma.

 

Dimostrativi (di), interrogativi-esclamativi (ie), indefiniti (in), personali (pe), possessivi (po), relativi (re). Enclitiche

Seguendo le indicazioni della Crusca, è stata abolita la distinzione fra aggettivo e pronome; pertanto sotto «questo» (di) si trovano tanto le forme pronominali quanto quelle aggettivali del dimostrativo «questo».

Si sono registrati come indefiniti nessi come «non so che», che non sono stati suddividi nei loro lemmi costitutivi.

Nel caso di forme diverse per maschile e femminile, di norma si è assunto come lemma il maschile singolare.

Le particelle pronominali enclitiche semplici («gli», «lo», «vi», ecc.) o doppie («me ne») sono state ricondotte ai loro lemmi non enclitici (pertanto «dimmi», registrato come «dire» e «mi», conterà per due occorrenze). Sono state conservati in un unico lemma gli enclitici doppi tipo «glielo», «gliela», «gliene». Le forme atone del personale «se» sono registrate sotto «sé».

 

Interiezioni ed esclamazioni (es)

In questa categoria rientrano le consuete particelle e voci esclamative e vocative. Da segnalare che alcuni lemmi («addio», «basta», ecc.) compaiono come esclamazioni e come sostantivi o verbi, a seconda dell’uso.

Forme come «ecco» e «sissignore», che possono avere anche una sfumatura esclamativa, sono state sempre registrate come avverbio.

 

Voci inglesi (en), greche (gr), latine (lt), onomatopeiche (on), siciliane (si), maltesi (ml) , fenicie (fe)

Per la lemmatizzazione delle voci non italiane la norma seguita è stata quella di assumere come lemma la forma in cui esse ricorrono nel testo, e di indicare quindi non la loro categoria grammaticale ma l’idioma a cui appartengono. Non si è proceduto in questo caso all’analisi morfologica, e le forme sono stati inserite nel normale ordine alfabetico. Sono state mantenute anche nel lemma le traslitterazioni (volutamente scorrette) di anglismi come «bai bai» e forme siciliane come «cùscusu».

 

Nomi propri (np)

Sotto questa categoria sono stati unificati tutti i nomi di persona, di luogo, di monumento, ecc., ma anche i titoli di giornale, opere o componimenti citati. Sono stati registrati come lemmi a sé stanti il nome di battesimo e il cognome.

I nomi di monumento o luogo composti con «Santo» sono stati registrati con lemmi di due o più elementi, mentre ai santi vengono normalmente attribuiti due lemmi: uno per il nome proprio e uno per l’aggettivo «santo».

 

Numerali (nu) e numeri (nm)

Sono stati lemmatizzati come numerali gli aggettivi numerali cardinali e ordinali scritti in lettere, e come numeri, arabi o romani, tutte le cifre.

I numeri, ordinati sulla base della prima cifra, costituiscono parte integrante della concordanza e si trovano raccolti alla fine.

Nella lemmatizzazione non si è proceduto ad alcuna integrazione, e così, ad esempio, ’60 e ’70 sono stati lemmatizzati senza aggiungere le cifre iniziali, anche se stanno per 1860 e 1870.

 

Preposizioni (pr)

Le preposizioni articolate non hanno nella concordanza autonomia di lemma, e perciò le loro forme sono state riportate alle relative preposizioni semplici. Le poche forme arcaicizzanti di «per» («pei» e «pel») si trovano sotto il lemma «per».

Locuzioni prepositive del tipo «in mezzo a» sono state sciolte in tre lemmi (preposizione «in», sostantivo «mezzo», preposizione «a»), mentre si è dato un lemma a due membri a «fuorché, fuori che». Per la locuzione «prima di» si è distinto un lemma per il valore congiuntivo e uno per quello prepositivo.

 

Sostantivi femminili (sf) e maschili (sm)

I sostantivi sono stati tutti riportati al lemma al singolare, anche se al plurale sono di genere diverso rispetto al singolare (ad es. «pugno» / «pugna»). Nel caso di sostantivi di genere mobile (come «compagno» e «compagna») si sono inseriti due lemmi.

Si è poi registrato il lemma al plurale in caso di pluralia tantum («mutande», «nozze»), o in mancanza della forma del singolare ormai desueto.

Se usati chiaramente con funzione sostantivale, sono stati classificati come sostantivi maschili l’aggettivo, il verbo e parole normalmente appartenenti ad altre categorie grammaticali (ad es. in «dall’a alla z», in «dargli del tu», «poco», «più»).

Si sono considerati sostantivi comuni quelli riferentisi a nomi religiosi («Dio», «Vergine»), festività, mesi, popoli, professioni, ordini religiosi, ecc.

Sono stati considerati come italiani quei sostantivi, non molti, che, anche mantenendo la grafia della lingua originaria, sono ormai entrati definitivamente nell’uso italiano.

 

Verbi (ve)

Si è adottata la regola generale di lemmatizzare i verbi all’infinito presente attivo, anche quando si fosse in presenza di un verbo riflessivo o intransitivo pronominale (ad es., «s’avventano» è registrato sotto «avventare», ecc.), a patto però che il verbo abbia nell’uso anche la forma transitiva. In accordo con i dizionari, si è registrato il lemma nella forma intransitiva pronominale («accorgersi», «lagnarsi»,«vergognarsi», ecc.) solo quando manca la forma transitiva.

Per i verbi «essere» e «avere» si è distinto l’uso predicativo e l’uso ausiliare con le sigle «pred.» e «aus.» poste tra parentesi. Questi verbi possono essere ausiliari di sé stessi, e ogni loro forma composta è stata lemmatizzata scomponendola nei singoli componenti: così, ad esempio, «ho avuto» è registrato (e computato) sotto «avere (aus.)» per la forma «ho», e sotto «avere (pred.)» per «avuto».

Come leggere la concordanza

Le concordanze qui presentate sono relative al romanzo I vecchi e i giovani e alle «tragedie» Enrico IV, La vita che ti diedi, Diana e la Tuda. Esse sono presentate su una colonna di stampa, nella quale si distinguono una riga in neretto con il lemma e la zona sottostante con i contesti, che non si trovano quando le categorie grammaticali sono articoli, preposizioni e congiunzioni. Es.:

 

919 – avanzare, ve, 3, 0,00199

VG I4 0094 4 strettura del tempo che avanza. E sentiva mancarsi il respiro;
VG I5 0102 8 sorvegliante… Che può avanzare per chi sta sotto terra e
VG I5 0113 5 fa’ valere il tuo merito, avanzerai! Nossignori, nossignori…

 

Come si vede, nella riga del lemma, si trovano in successione: 1) il numero progressivo del lemma, che ne indica la posizione nella successione alfabetica; 2) il lemma, indicato o nella forma registrata dai dizionari, oppure in quella in cui ricorre nel testo, nel caso di parole straniere. Si trova talvolta subito dopo il lemma una specifica indicante l’uso ausiliare o predicativo dei verbi «essere» e «avere» («aus.» / «pred.») oppure la presenza di forma omografa («om.»); 3) la categoria grammaticale, indicata con due lettere minuscole, relativa alla categoria grammaticale o alla lingua del lemma); 4) un numero intero, indicante la frequenza assoluta del lemma nel testo (cioè quante volte esso ricorre); 5) un numero decimale, quasi sempre inferiore a 1, indicante la frequenza relativa del lemma rispetto al totale delle parole del testo. Questa cifra è frutto del rapporto percentuale tra la frequenza assoluta del lemma e il totale delle occorrenze di parola.

 

Il contesto viene indicato da una stringa di testo, contenente al ‘centro’ il lemma classificato, ed è preceduta dalla sigla dell’opera (VG = I vecchi e i giovani; DT = Diana e la Tuda; VD = La vita che ti diedi; EN = Enrico IV) seguita dalla riga del testo di riferimento, che per le opere in prosa è dato dal numero di pagina seguito da quello del capoverso, mentre per le opere teatrali dal numero di pagina seguito dal capoverso del turno di battuta.

Di seguito le sigle delle categorie grammaticali utilizzate nella concordanza:

ag aggettivo qualificativo
ar articolo
av avverbio
co congiunzione
di aggettivo o pronome dimostrativo
en voce inglese
es esclamazione o interiezione
fe voce fenicia
fr voce francese
gr voce greca translitterata
ie aggettivo o pronome interrogativo o esclamativo
in aggettivo o pronome indefinito
lt voce latina
ml voce maltese
nm numero (in cifre)
np nome proprio
nu aggettivo o pronome numerale
on onomatopea
pe pronome personale
po aggettivo o pronome possessivo
pr preposizione
re aggettivo o pronome relativo
sf sostantivo femminile
si voce siciliana
sm sostantivo maschile
vc voce non altrimenti definibile
ve verbo

 

Nell’edizione digitale viene reso disponibile un motore di ricerca in grado di interrogare singoli lemmi, relativi però a tutte e quattro le opere.

A corredo della concordanza si troveranno anche le liste di lemmi e di forme per frequenza crescente e decrescente, nonché per categoria grammaticale, e gli Elenchi delle forme proprie, ovvero delle forme tipiche di una edizione, non comprese dunque nel testo concordato (si troveranno ad esempio in questa sezione le forme di I vecchi e i giovani 1909 e 1931 che non sono comuni anche all’edizione del 1913).