Blogger: poetaselvaggio

Contatti:

poeta.selvaggio(at)gmail.com

Feeds

Pulsanti

GeoURL

Ricerche nel blog

Contatore

visitato *loading* volte

Crediti

La foto del Golden Gate Bridge è di Francesco Meschia

domenica, 24 giugno 2007
I dizionari di Google. (Speriamo che sia beta.)

Apprendo dalle news del Gruppo L10N (qui il link ai feed) che Google ha lanciato una serie di dizionari on-line nella sezione Traduttore. Diamo un'occhiata, mi dico, sono utente dei vari servizi del motore di ricerca di Mountain View, magari anche questa volta hanno escogitato qualcosa di nuovo. Se i documenti e i fogli di lavoro on-line fanno intravvedere nuove prospettive nelle applicazioni per ufficio, può darsi che i dizionari possano mettere in difficoltà i tradizionali strumenti cartacei o gli altri simili servizi su Web. Vediamo allora, e l'analisi che segue è basata sulla coppia inglese-italiano, italiano-inglese.

 

Fondamentale, ma non di più

Il sito è semplice, con una casella per inserire la parola e un casella a discesa per selezionare il dizionario. Il lemmario contiene le parole fondamentali delle due lingue, ma mancano parole definite comuni dal De Mauro come abbaino, cangiante, campioncino, genitale, macchinetta, sottostimare. Sono assenti termini semi tecnico-specialistici come cobalto, dentatura, ecatombe, eccipiente, liberista, pastoia. Nella parte inglese-italiano mancano catchphrase, ca(u)ldron, chinz, h(a)emophilia, handgun, immaterial, pageant, peculiar, semantics, Tipp-Ex. Alcuni lemmi hanno accezioni incomplete e includono solo significati secondari: deflate significa solo "smontare", il primo significato di slide è "fermacapelli", il nome move è solo "trasloco" (di questo, di più sotto), ball è solo "pallone" e non "ballo".

 

Una struttura discriminante

Ciascuna voce è composta da lemma, accezioni e traduzioni e dalle frasi correlate. Per un esempio si veda move: i traducenti hanno il genere e sono presenti glosse per distinguere i sensi: "emotionally", "of troops". Le glosse sono in inglese nella parte inglese e in italiano nella parte italiana. Oltre alle glosse, sono presenti discriminatori di significato con funzione di collocatori (parole che più frequentemente accompagnano il termine) o sinonimi: "di persone". Qui vedo una incoerenza: non si capisce perché move along abbia un collocatore in italiano "di persone", mentre move out è preceduto da "of troops", in inglese. L'incongruenza diventa lampante con go:

di cibi go bad, spoil
guastarsi  

go off
of milk etc andare a male , of light spegnersi , of alarm scattare , of gun sparare , of bomb esplodere

dove un discriminatore simile in una struttura simile è trattato in modo diverso.

La sezione "Frasi correlate" è un sorta di cestino dove si mette di tutto, dagli esempi ai phrasal verbs, da significati secondari ai sinonimi. Questo mi permette di addentrarmi ancora di più nella voce.

 

Il girone, prima di tutto

Come si può notare in move, non ci sono omografi e parti del discorso diverse sono trattate come accezioni diverse:

move
1. trasloco m  2. emotionally commuovere  3. spostare, muovere  4. muoversi, spostarsi  5. muovere

Il nome e il verbo sono infilati sotto lo stesso lemma, e si può anche fare, ma almeno sarebbe utile distinguere la differenza di categoria in modo un po' più chiaro che con il solo m del maschile. L'accezionamento è originale e incomprensibile: che differenza c'è tra il sensi 3 e 5? L'ordine delle accezioni è singolare: "commuovere" viene prima di "muovere" e "spostare", ma leg fa meglio:

leg
1. girone m  2. tappa f  3. cosciotto m  4. coscia f  5. zampa f  6. gamba f

"girone", "tappa" e  perfino "cosciotto" precedono "gamba", ultimo significato! Arm è solo "bracciolo" e il modesto "braccio" finisce nelle frasi correlate.

 

La correlazione dell'amante 

Mi verrebbe da chiedere frasi correlate a cosa, visti alcuni esempi. Si veda amante per esempio:

amante
1. lover;

Frasi correlate
amante della musica
music lover

amante f
mistress

amante m/f
lover

In base a che cosa si distingue tra lover traducente e lover frase correlata? Se volessimo tradurre acquazzone saremmo posti di fronte a un dubbio amletico:

acquazzone
1. downpour

Frasi correlate
acquazzone m
shower

la frase correlata è un semplice sinonimo? È idiomatica? E come lo capiamo?

L'incomprensibilità di certi esempi raggiunge il suo culmine con gli articoli. Sotto il troviamo frasi esemplari dell'uso dell'articolo come:

mettere il veto a
veto v
mettere il bloccaruota a
clamp (si noti la differenza di trattamento)
il numero dei pazienti del mio dottore
my doctor’s caseload
non rivoltare il coltello nella piaga!
don’t rub it in!

Sembra proprio che la parte inglese sia stata ribaltata in italiano e si siano inseriti degli esempi in cui a un articolo italiano corrisponde un costrutto particolare inglese. Si arriva a paradossi in la dove troviamo:

aprire (con la chiave)
unlock v

la compare nella specificazione del senso di "aprire" e non nell'esempio vero e proprio.

Ultima curiosità delle frasi correlate la troviamo in mobile dove possiamo imbatterci in:

mobile m inv
mobile

Cosa sia questo mobile maschile invariabile non è chiaro, l'unica cosa che trovo è un riferimento a Calder: particolare tipo di scultura, costituita da una serie di lamine sottili sospese a fili metallici che il minimo movimento d'aria fa mutare di posizione. Lasciamo perdere gli esempi in lire (hanno preso qualche dizionario vecchiotto?)

 

Il Google che non contiene se stesso

Non mi soffermerò sull'uniformità di voci appartenenti alla stessa categoria (vi lascio il compito a casa di confrontare italiano, francese, spagnolo, tedesco), ma considerato quanto detto sopra nulla porta a giudicare i dizionari di Google migliori di altri on-line, anzi, e siamo secoli luce dai dizionari cartacei in commercio. Probabilmente Google non vuole far concorrenza ai dizionari tradizionali, ma solo fornire uno strumento che integri le funzioni di traduzione automatica o che aiuti a trovare velocemente un termine. Anche se le traduzioni sono sostanzialmente corrette, l'importante è che l'utente non ne faccia la sua fonte  principale. Non escludo di consultare anch'io i dizionari spagnolo-inglese, coreano-inglese o tedesco-inglese, ma sempre con una certa cautela. Tutta la sezione Google Traduttore è in beta, ma i dizionari italiani non vengono segnalati come tali. Eppoi se nessun dizionario di Google contiene il termine Google può darsi che neanche loro ci credano troppo.

Postato da: nicpoeta, 24/06/2007 20:04 | link | commenti (5)
dizionari visionari


Commenti
#1   25 Giugno 2007 - 21:59
 
Ambrose Bierce definiva i lessicografi "pestilent fellows who, under the pretense of recording some particular stage in the development of a language, do what they can to arrest its growth, stiffen its flexibility and mechanize its methods".
La I del vecchio FIGS sta scomparendo a vantaggio dell'indi, o del portoghese, o del cinese.
Quasi trent'anni fa, andando in treno da Napoli a Pisa mi capitò di sentire alcuni spagnoli commentare negativamente la mancanza di avvisi ai viaggiatori in castigliano.
Oggi, ma forse non solo oggi, tocca a noi: gli spagnoli non si hanno più motivo di lamentarsi.
Più che lamentarsi del vocabolario di Google, che ovviamente si rivolge a un pubblico molto preciso, dovremmo rimproverarci l'assoluta mancanza di una politica linguistica, a partire da un'attenzione, tanto per cambiare, ipocrita e manichea e affatto interessata alla disciplina terminologica.
Ogni volta che sento annunciare un nuovo "progetto di ricerca" da qualche augusto barone della nostra Accademia sento un brivido percorrermi la schiena e penso: "Alè!"
Del resto, l'Accademia della Crusca ha appena attribuito il premio Galileo a un linguista ottuagenario e a un'attrice ultrasettantenne...
E spuntano come funghi sedicenti "scrittori" che cominciano con il volerci spiegare come si scrive per il Web, in azienda, per i giornali, per la pubblicità (mancano i bugiardini e i bigliettini dei Baci) e finiscono per lanciarsi in avventurose imprese letterarie. Ma la documentazione tecnica italiana e in italiano continua a fare scandalosamente schifo.


Luigi Muzii
utente anonimo

#2   26 Giugno 2007 - 20:53
 
Beh, Bierce era un lessicografo del diavolo! I lessicografi che conosco io fanno di tutto per mostrare la vitalità della lingua, e non mi riferisco a una spruzzata di qualche neologismo. Per forza di cose un dizionario è una struttura chiusa e tutte le lingue ci stanno strette.
La mia non è tanto una lamentela sui dizionari di Google (anzi, non ero per nulla prevenuto), quanto un'analisi con qualche strumento lessicografico per dimostrare che se una cosa si chiama Google non è per forza affidabile.
Lo studio della lingua italiana ha avuto notevole sviluppo negli ultimi trent'anni, sono uscite opere importanti, sia in campo lessicografico sia dell'analisi della lingua e se una volta bisognava aspettare qualche decina d'anni per fare, che so, un seminario sulla linguistica strutturale, ora siamo più permeabili alle novità (ammesso che nella linguistica si inventi mai qualcosa di nuovo). Può darsi che questo interesse arrivi poco per volta anche alle discipline terminologiche. Ma noi siamo così: una volta scoperte tecnologie come software per l'analisi di corpus e concordanze, le applichiamo a Dante e Boccaccio e solo dopo un po' di tempo a testi tecnico-scientifici.
Blogger: Contattami Guarda il mediablog (foto, audio e video) di questo utente. Blocca questo utente nicpoeta

#3   26 Giugno 2007 - 22:35
 
Abbiamo evidentemente esperienza diversa dei lessicografi (o almeno di quelli sedicenti tali) italiani.
Il Web è stracarico di dizionari e vocabolari e povero di basi terminologiche, tanto che le cose migliori si trovano spesso in Wikipedia.
Onestamente non so che farmene di studi di linguistica strutturale se poi i risultati sono quelli, scadenti, sotto gli occhi di tutti, a cominciare dalle vaghe e incerte risposte date da linguisti di fama, chiara e oscura, dalle pagine dei giornali, o dal contenuto di vocabolari che hanno la pretesa di mantenere aggiornata la lingua, ma evitano accuratamente di fornire gli strumenti per utilizzarla correttamente.
Google non è affidabile nemmeno come spider, scooter, crawler (chiamamolo come vogliamo) figuriamoci come "motore di ricerca". Chiedere ai cinesi per conferma.
Io mi limitavo ad affermare che l'ignoranza in cui viviamo produce ignoranza della nostra cultura anche in altre culture. La notizia di quell'imbecille che si è fatto la scalinata di Trinità de' Monti in macchina è stata accolta con ilarità, forse con sarcasmo, certamente con indifferenza.
Non più di venti anni fa, in Italia, nella regione in cui si trova, nascevano la televisione digitale e il motore a gasolio a iniezione diretta.
Quindi può darsi che io mi sia perso qualcosa, ma lo sviluppo che lo studio della lingua italiana avrebbe avuto negli ultimi trent'anni non riesco a vederlo, mi dispiace.
A Pisa vive e lavora ancora uno dei più geniali informatici linguisti (non un linguista computazionale, che spesso, almeno da noi, non sa neanche trovare il pulsante di accensione di un portatile), praticamente abbandonato a se stesso. Dobbiamo a lui i primi programmi di analisi linguistica. E se oggi usiamo quelli di altri, magari senza capirci un piffero, applicandole solo a Dante e Boccaccio (il Nostro almeno lavorava già su Leopardi) è proprio perché quello sviluppo di cui sopra non c'è stato.
Gli stranieri pensano ancora all'Italia come alla terra di Leonardo e Michelangelo, gli Uffizi, Venezia, la piazza dei Miracoli, il Colosseo ecc. Tralascio le ovvie considerazioni sulla modesta attenzione che abbiamo per tutto questo e mi limito a chiedere: e il resto? E di chi è la colpa se esistono solo l'arte e la cultura del tempo di Dante e Boccaccio?
Ci sarà una ragione se abbiamo un presidente della Repubblica ultraottuagenario, un presidente del consiglio settantenne, un capo dell'opposizione ultrasettantenne e consideriamo giovane un politico di cinquantadue anni che fa politica da quando ne aveva sedici?
Giorni fa qualcuno mi chiedeva consiglio su opere di narrativa italiana con cui deliziarsi sotto l'ombrellone. Riuscivo solo a pensare alla Littizzetto...
Lancio una proposta: cinque titoli di autori italiani pubblicati negli ultimi dodici mesi che valgano almeno 4 su una scala da 1 a 5, siano cioè in grado di reggere il confronto con la letteratura tradotta.


Luigi Muzii
utente anonimo

#4   27 Giugno 2007 - 20:53
 
Posso assicurare che i lessicografi che conosco io sono persone preparate, attente e appassionate del loro lavoro, che è tra l'altro un mestiere che non finisce mai perché con le parole ci viviamo. (Tutti siamo un po' sedicenti lessicografi, così come ct della nazionale di calcio, ma i "miei" lessicografi hanno il non piccolo pregio di avere il loro nome sui dizionari più diffusi.) Ovvio che come in tutti i mestieri budget, tempo e forze sono limitati.
Alcune opere sull'italiano degli ultimi 20-30 anni (sono rimasto un po' indietro, sicuramente ci sono opere nuove e interessanti): Grande dizionario dell'uso, 6 voll., De Mauro, Utet; Vocabolario della lingua italiana Treccani, 5 voll.; è stato portato a termine il Battaglia (anche se non finirà mai); Grammatica italiana di Luca Serianni; Nuova grammatica della lingua italiana di Dardano e Trifone; Grande grammatica italiana di consultazione, 3 voll., Renzi, Salvi, Cardinaletti, Il Mulino; e ancora Introduzione all'italiano contemporaneo, A.A. Sobrero, Laterza. Ripeto: sono più le cose che lascio fuori che quelle che cito, ma per me quasi tutti questi sono monumenti.
Devo tuttavia ammettere che se agli esami vediamo sui banchi degli studenti dizionari degli anni '60 un motivo ci sarà.
Non sono un conoscitore delle novità editoriali ma recentemente ho apprezzato Genna, Ammaniti, Perissinotto, Wu Ming (volendo Piperno, Lucarelli). Forse ci manca un Jonathan Safran Foer, ma non è detto che sia un male.
Blogger: Contattami Guarda il mediablog (foto, audio e video) di questo utente. Blocca questo utente nicpoeta

#5   27 Giugno 2007 - 23:00
 
Solo un commento su De Mauro e Battaglia: temo che siano passati un po' più di trent'anni, visto che il primo aveva cominciato a sistemare i primi mattoni della sua monumentale opera quando gli fecero scomparire il fratello e l'opera del secondo è largamente postuma.
Su Serianni e Dardano mi astengo... Mi chiedo quanto ci sia del loro e quanto dei loro "collaboratori".
Quanto alla Cardinaletti, "L'italiano delle traduzioni" è stata una cocente delusione.
Forse sono io che chiedo troppo ad aspettarmi da un linguista un contributo determinante al lavoro del redattore o del traduttore.
Ammanniti e Lucarelli, certo, ma allora anche Camilleri, e Moccia, e Faletti.
Ma il Salinger italiano esiste?
Conferm: 5 titoli 5. Io non ce li ho, ma forse, anche qui, sono io ad essere troppo esigente. Forse è l'abitudine ai saggi...


LM
utente anonimo

Commenti