La linguistica dei corpora
1. La parola testo si riferisce a: testi scritti solamente testi parlati e scritti sequenze di caratteri
2. Il Dictionary of the English Language (1755-1756) di Samuel Johnson è un dizionario: corpus based corpus driven nessuno dei due
3. Un corpus è considerato rappresentativo di una varietà di lingua se: presenta caratteri qualitativamente simili alla popolazione presenta caratteri quantitativamente simili alla popolazione contiene tutta la popolazione
4. Se si vuole costruire un corpus per uso lessicale, quale dovrebbe essere oggi la sua estensione standard? 15.000 occorrenze 100.000 occorrenze 500.000 occorrenze 1 milione di occorrenze 100 milioni di occorrenze 500 milioni di occorrenze
5. Il British National Corpus è: ampio 100 milioni di occorrenze ampio 500 milioni di occorrenze un corpus statico un corpus dinamico
6. La Bank of English è: un corpus di 100 milioni di occorrenze un corpus di 500 milioni di occorrenze un corpus statico un corpus dinamico
7. Nei corpora campionari (sample corpora) i testi sono: interi qualunque sia la loro lunghezza tutti lunghi uguali
8. Il CODIS (Corpus dinamico dell'italiano scritto), elaborato e coordinato da Rema Rossini Favretti è: ampio 500.000 occorrenze ampio 100 milioni di occorrenze un corpus statico un corpus dinamico
9. Che cosa sono i separatori? l'alfabeto tutto ciò che non è l'alfabeto le pause, tutto ciò che interrompe il discorso
10. Che cos'è una parola grafica? un simbolo una sequenza di caratteri separata da punteggiatura o spazi una polirematica
11. In un testo in genere sono di più i tokens o i types? i tokens i types uguali
12. Qual è la formula del type/token ratio? V/N N/V T/TY
13. Quanto è ampio il LIP (Lessico di frequenza dell'italiano parlato, 1993)? 500.000 occorrenze 100 milioni di occorrenze 500 milioni di occorrenze
14. Il Corpus de Referencia de la Lengua Española Contemporánea (CREA) della Real Academia Española è ampio: 500.000 occorrenze 100 milioni di occorrenze 500 milioni di occorrenze
15. Che cosa significa che in un corpus parallelo i testi sono allineati? originali e traduzioni sono messi in corrispondenza frase per frase originali e traduzioni sono messi in corrispondenza parola per parola originali e traduzioni sono messi in corrispondenza testo per testo
16. Nei corpora multilingui i testi sono: in traduzione in traduzione reciproca relativi allo stesso argomento
17. Il web è un corpus? sì no
18. Il web è un corpus rappresentativo? sì no
19. Sono valide le statistiche di frequenza indicate da Google? sì no a volte
20. L'estensione del web è determinabile con certezza? sì no
21. Che cos'è l'annotazione o etichettatura linguistica? il commento di un testo una forma di codifica linguistica l'aggiunta di informazioni linguistiche ai testi
22. Che cos'è uno start-tag? una marca di fine una marca di inizio l'etichetta di una parola
23. Quale tra queste è un'etichettatura corretta? <title>The SICK ROSE</title> <title>The SICK ROSE<\title> <title>The SICK ROSE<title>
24. Cosa contiene il TEI header? informazioni statistiche informazioni bibliografiche e di riferimento il titolo
25. Che cosa significa DTD? Document Token Definition Document Type Definition Document TEI Definition
Grazie per avere risposto alle domande. Premi il pulsante Invia per inviare le tue risposte.
Powered by Best viewed with
Creato con WinAsks 2000 da Isabella Chiari