Cosa sono le risorse linguistiche?
L'obiettivo di questa lezione è fornire un'introduzione di base alle risorse linguistiche e alle loro applicazioni
Scopri il nostro catalogo esplorando le collezioni suddivise per argomento e infrastruttura di ricerca ospitante.
L'obiettivo di questa lezione è fornire un'introduzione di base alle risorse linguistiche e alle loro applicazioni
L'obiettivo di questa presentazione è quello di dare una visione d'insieme dei principi generali della gestione dei dati di ricerca e della loro applicazione alla gestione delle risorse linguistiche
In qualsiasi fase del processo di gestione dei dati di ricerca (research data management), è essenziale riconoscere gli standard e i formati più comuni in cui le risorse sono state create e potenzialmente archiviate. Questa presentazione fornisce una panoramica degli standard e dei formati disponibili e indica dove trovarli. Si tenga presente che la scelta degli standard e dei formati quando si creano nuove risorse linguistiche dipende il più delle volte dalla scelta del repository di dati di ricerca in cui si decide di conservare la risorsa.
In questo blocco di contenuti didattici, gli studenti utilizzeranno i servizi di CLARIN (https://www.clarin.eu/) per la ricerca linguistica. CLARIN è l’acronimo di "Common Language Resources and Technology Infrastructure". Questa presentazione spiega brevemente cos'è CLARIN e come accedere ai servizi principali. Esercitazioni più dettagliate saranno fornite nella Unità 3. Trovare e (ri)utilizzare le Risorse Linguistiche nei repository CLARIN.
La pagina [CLARIN Impact Stories](https://www.clarin.eu/content/clarin-impact-stories) contiene una raccolta di ricerche innovative che utilizzano risorse CLARIN e strumenti per indagare questioni sociali più ampie. Gli studenti dovranno leggere una storia su un argomento di loro interesse e rispondere alle relative domande.
Prima di iniziare il vostro progetto di ricerca, verificate se i dati linguistici di cui avete bisogno esistono già. Ad esempio, si potrebbe prendere in considerazione la possibilità di riutilizzare un corpus esistente piuttosto che compilare e costruire un nuovo corpus. Il riutilizzo di risorse già pubblicate evita inutili duplicazioni di lavoro. Questa unità vi mostrerà come i repository dei dati della ricerca contribuiscono a rendere le risorse linguistiche FAIR, cioè a renderle reperibili attraverso metadati coerenti, a garantire l'accessibilità con permessi di accesso controllati, a promuovere l'interoperabilità attraverso formati standardizzati e a consentire la riusabilità attraverso la conservazione a lungo termine e gli identificatori persistenti (persistent identifiers -PID).
Anteprima
Copiato!