Exploring the Semantic Web Stack
This lesson explores the Semantic Web Stack. After defining the Semantic Web, it provides a detail of its principal layers and their function.
53 risultati
This lesson explores the Semantic Web Stack. After defining the Semantic Web, it provides a detail of its principal layers and their function.
Having achieved popularity as a way of publishing and accessing data in different fields of the sciences and for sharing large encyclopaedic datasets such as DBpedia (derived from Wikipedia), linked data is becoming more and more popular in different areas of the humanities. In this course we will present a comprehensive introduction to the creation, publication, and use of linked open data for anyone who wants to work with linguistic datasets – such as lexicons and corpora – and especially for those who come from a linguistic or humanist background. We will look at the basics of linked data and the Semantic Web and introduce the various different standards technologies that make up the Semantic Web stack before focusing on the particular case of linked data language resources. During the course we will study the most important tools, vocabularies, and resources available in the Semantic Web and provide hands-on training for the creation and querying of linguistic linked data. We will look at how Semantic Web technologies can contribute to the creation of FAIR language resources as well as how to publish your resource on the linked open data cloud. We will also show how the Semantic Web query language SPARQL can be a powerful tool for data exploration.
Questa pagina contiene dei suggerimenti per gli insegnanti che utilizzeranno questo glossario in classe. Gli insegnanti possono utilizzare questo glossario nel modo seguente: - Condividete il glossario con gli studenti all'inizio del corso per farli familiarizzare con i concetti chiave (https://upskills.fil.bg.ac.rs/mod/glossary/view.php?id=515) relativi alle infrastrutture di ricerca per le risorse e le tecnologie linguistiche e alla gestione dei dati della ricerca linguistica. Durante la revisione dei contenuti didattici, chiedete agli studenti di aggiungere i concetti mancanti e le loro definizioni. - Gli studenti possono controllare le definizioni dei termini durante lo svolgimento del corso. Alcuni termini contengono riferimenti a video che possono aiutare gli studenti a comprendere i principali concetti correlati. - Gli insegnanti di qualsiasi disciplina sono incoraggiati a includere nei loro corsi le competenze di base per la gestione della terminologia, sulla base della norma ISO 704:2009 (https://www.iso.org/standard/38109.html)
Si tratta di una panoramica di facile consultazione dei principi di Austin per la citazione dei dati in linguistica, che può essere utilizzata come risorsa didattica per discutere ogni principio con gli studenti.
This learning block introduces the topics of the course and provides some scientific background .
Questo corso introduce gli studenti ai depositi di dati della ricerca e al loro ruolo nel ciclo di vita dei dati linguistici nel contesto dei principi FAIR e Open Science. Il corso include un progetto finale e un glossario per apprendere i termini tecnici della disciplina.
I dati linguistici sono essenziali per la comunicazione, la ricerca linguistica e lo sviluppo di strumenti di Trattamento Automatico del Linguaggio (TAL). Tuttavia, la ricerca di risorse linguistiche rilevanti per un determinato compito rimane un'impresa ardua, poiché esse sono sparse in diversi depositi (sia generalistici che specifici per ciascun dominio disciplinare), istituti di ricerca o addirittura salvati sul computer del singolo ricercatore. In questa unità, imparerete a conoscere il ruolo delle infrastrutture e dei depositi di dati di ricerca nella gestione, nella citazione, nella riusabilità e nella diffusione delle risorse linguistiche.
Lo scopo di questa lezione è quello di fornire un'introduzione all'uso dei repository di dati della ricerca e identificare sia le piattaforme di repository comuni che i repository di dati di ricerca rilevanti per la ricerca linguistica.
Il corso affronta le tematiche legate alla gestione dei dati linguistici orali. Dopo un'introduzione generale alle possibilità offerte dall'infrastruttura CLARIN ERIC in fase di scoperta, raccolta e deposito di dati orali, si approfondiranno le questioni etico-legali connesse alla raccolta, gestione e conservazione dei dati e il procedimento di trascrizione automatica, con ulteriori possibilità di annotazione attraverso strumenti ti trattamento automatico del linguaggio.
Prima di esaminare più da vicino i servizi e gli strumenti CLARIN per l'elaborazione del testo, è importante familiarizzare con alcuni concetti e metodi di base utilizzati nel trattamento automatico del linguaggio o TAL (natural language processing, NLP). Si tratta di una branca dell'informatica che studia i metodi per aiutare i computer a comprendere il testo e il parlato nello stesso modo in cui lo fanno gli esseri umani. Spesso si interagisce con la PNL senza esserne pienamente consapevoli, ogni volta che si utilizza Siri sul proprio iPhone o l'assistente virtuale Amazon Alexa per riprodurre musica o acquistare qualcosa, il software di dettatura speech-to-text (ad esempio Dragon Naturally Speaking), Grammarly per il controllo ortografico o, ultimamente, ChatGPT per aiutarci a raccogliere rapidamente informazioni su un argomento.