Logo

La linguistica dei corpora



Cognome:
Nome:


1. La parola testo si riferisce a:

    testi scritti solamente
    testi parlati e scritti
    sequenze di caratteri

2. Il Dictionary of the English Language (1755-1756) di Samuel Johnson è un dizionario:

    corpus based
    corpus driven
    nessuno dei due

3. Un corpus è considerato rappresentativo di una varietà di lingua se:

    presenta caratteri qualitativamente simili alla popolazione
    presenta caratteri quantitativamente simili alla popolazione
    contiene tutta la popolazione

4. Se si vuole costruire un corpus per uso lessicale, quale dovrebbe essere oggi la sua estensione standard?

    15.000 occorrenze
    100.000 occorrenze
    500.000 occorrenze
    1 milione di occorrenze
    100 milioni di occorrenze
    500 milioni di occorrenze

5. Il British National Corpus è:

    ampio 100 milioni di occorrenze
    ampio 500 milioni di occorrenze
    un corpus statico
    un corpus dinamico

6. La Bank of English è:

    un corpus di 100 milioni di occorrenze
    un corpus di 500 milioni di occorrenze
    un corpus statico
    un corpus dinamico

7. Nei corpora campionari (sample corpora) i testi sono:

    interi qualunque sia la loro lunghezza
    tutti lunghi uguali

8. Il CODIS (Corpus dinamico dell'italiano scritto), elaborato e coordinato da Rema Rossini Favretti è:

    ampio 500.000 occorrenze
    ampio 100 milioni di occorrenze
    un corpus statico
    un corpus dinamico

9. Che cosa sono i separatori?

    l'alfabeto
    tutto ciò che non è l'alfabeto
    le pause, tutto ciò che interrompe il discorso

10. Che cos'è una parola grafica?

    un simbolo
    una sequenza di caratteri separata da punteggiatura o spazi
    una polirematica

11. In un testo in genere sono di più i tokens o i types?

    i tokens
    i types
    uguali

12. Qual è la formula del type/token ratio?

    V/N
    N/V
    T/TY

13. Quanto è ampio il LIP (Lessico di frequenza dell'italiano parlato, 1993)?

    500.000 occorrenze
    100 milioni di occorrenze
    500 milioni di occorrenze

14. Il Corpus de Referencia de la Lengua Española Contemporánea (CREA) della Real Academia Española è ampio:

    500.000 occorrenze
    100 milioni di occorrenze
    500 milioni di occorrenze

15. Che cosa significa che in un corpus parallelo i testi sono allineati?

    originali e traduzioni sono messi in corrispondenza frase per frase
    originali e traduzioni sono messi in corrispondenza parola per parola
    originali e traduzioni sono messi in corrispondenza testo per testo

16. Nei corpora multilingui i testi sono:

    in traduzione
    in traduzione reciproca
    relativi allo stesso argomento

17. Il web è un corpus?

   
    no

18. Il web è un corpus rappresentativo?

   
    no

19. Sono valide le statistiche di frequenza indicate da Google?

   
    no
    a volte

20. L'estensione del web è determinabile con certezza?

   
    no

21. Che cos'è l'annotazione o etichettatura linguistica?

    il commento di un testo
    una forma di codifica linguistica
    l'aggiunta di informazioni linguistiche ai testi

22. Che cos'è uno start-tag?

    una marca di fine
    una marca di inizio
    l'etichetta di una parola

23. Quale tra queste è un'etichettatura corretta?

    <title>The SICK ROSE</title>
    <title>The SICK ROSE<\title>
    <title>The SICK ROSE<title>

24. Cosa contiene il TEI header?

    informazioni statistiche
    informazioni bibliografiche e di riferimento
    il titolo

25. Che cosa significa DTD?

    Document Token Definition
    Document Type Definition
    Document TEI Definition


Grazie per avere risposto alle domande. Premi il pulsante Invia per inviare le tue risposte.



Powered by WinAsks 2000 Best viewed with Microsoft Internet Explorer Netscape Navigator

Creato con WinAsks 2000 da Isabella Chiari