La Fondazione Levi, nell’ambito del progetto LeviData, ha deciso di trasformare in Linked Open Data e
liberare sul Web of Data un primo nucleo del proprio patrimonio. La scelta è ricaduta su tre authorities:
Authority Luoghi, Authority Enti/Famiglie/Persone EAC-CPF e Authority Eventi. Tale scelta risulta strategica,
poiché i tre database sono fondamentali punti di accesso alle informazioni, collegati tra loro ma anche a
tutta la documentazione storica e corrente.
Le scelte di modellazione
La modellazione risultante vede l’evento, localizzato in un luogo geografico e organizzato da un agente
(solitamente enti e istituzioni), che si svolge in una o più localizzazioni fisiche (come una specifica sala di un
palazzo).
Per ognuno di questi concetti sono state poi modellate anche le specifiche informazioni riportare nelle
schede catalografiche.
Le ontologie utilizzate per la modellazione sono state scelte sia per la loro diffusione in ambito
internazionale (Foaf1, Geonames2, Schema.org3, Skos4, Dublin Core5) che – ovviamente – per la loro aderenza al dominio di riferimento (Eac-cpf ontology6, Cultural-ON ontology7, ArCo8).
Per persone ed enti sono state modellate le informazioni sulle date di esistenza, luoghi di nascita e morte
quando disponibili, e informazioni sulle relazioni familiari. Si è scelto di tipizzare queste risorse sia come
foaf:Agent che come eac-cpf:Entity, specificando poi in base alla tipologia se si tratta di eac-
cpf:Corporateody (enti) o eac-cpf:Person (persone), perché le voci di authority sono anche entità coinvolte
nella descrizione archivistica. Quando possibile, le risorse sono state allineate semanticamente con risorse
contenute in altri dataset, come VIAF, Wikidata, Library of Congress e SBN. L’obiettivo di questa operazione
è duplice: collegare le risorse LeviData a fonti autorevoli che descrivono le stesse risorse, integrando le
informazioni ma ponendo anche la Fondazione Levi come provider di dati autorevoli, e aumentando la
visibilità e la discoverability da parte di soggetti terzi grazie agli interlinking in entrata e in uscita.
Gli Agenti, in particolar modo gli enti, sono collegati agli Eventi in quanto organizzatori degli stessi. Gli
Eventi sono stati rappresentati sia come schema:Event che come cis:CulturalEvent, specificando in questo
modo la natura culturale degli eventi descritti. Utilizzare Schema.org è inoltre una scelta che influenza la
visibilità dei dati, migliorando la comprensione semantica da parte dei motori di ricerca che riescono quindi
a restituire risultati con minor rumore in termini di ricerca.
Gli Eventi sono corredati poi da informazioni indispensabili per la loro identificazione: data, identificativo,
tipologia di evento (es. convegno, concerto, conferenza), descrizione e localizzazione, sia geografica - grazie
al collegamento con l’authority Luoghi, opportunamente espresso anch’esso in RDF - che fisica. Ogni evento
infatti può avere una o più sedi di rappresentazione, motivo per il quale è stata utilizzata la object property
della Location Ontology del progetto ArCo - a-loc:hasTimeIndexedTypedLocation – per rappresentare il
collegamento a più luoghi di rappresentazione nel tempo, indicando poi la localizzazione specifica (ad
esempio, Palazzo Giustinian Lolin presso la Fondazione Ugo e Olga Levi).
Infine, i Luoghi riportano la denominazione e sono stati modellati sia come schema:Place che gn:Feature.
Così come per gli agenti, anche i luoghi sono stati arricchiti grazie ad allineamenti semantici con Wikidata e
Geonames, recuperando così anche le coordinate geografiche: in questo modo sono state riutilizzate
informazioni già inserite in altri dataset, senza la necessità di replicare l’informazione nell’Authority Luoghi
Levi, in linea con le buone pratiche che caratterizzano questa modalità di pubblicazione delle informazioni.
Come esplorare i dati?
Nell’ambito del progetto sono resi disponibili diversi strumenti per interrogare, navigare ed esplorare i dati.
Per chi volesse confrontarsi con le query SPARQL, è possibile interrogare i dati utilizzando l’endpoint
SPARQL di progetto. Di seguito, alcuni esempi di domande a cui è possibile rispondere.
Quali sono gli eventi descritti?
select distinct * where
{?event a <http://dati.beniculturali.it/cis/CulturalEvent>; rdfs:label ?evento}
Clicca qui per il risultato
Quali sono le tipologie di eventi?
select distinct * where
{?eventType a <http://www.w3.org/2004/02/skos/core#Concept>; rdfs:label ?tipologiaEvento}
Clicca qui per il risultato
E quanti eventi sono rappresentati per ogni tipologia?
select ?tipologiaEvento count(distinct ?event ) as ?numeroEventi where
{?event a <http://dati.beniculturali.it/cis/CulturalEvent>;
<http://purl.org/dc/terms/type> ?eventType.
?eventType rdfs:label ?tipologiaEvento}
Clicca qui per il risultato
Quale ente ha organizzato più eventi?
select ?ente count(distinct ?event ) as ?numeroEventi where
{?event a <http://dati.beniculturali.it/cis/CulturalEvent>; https://schema.org/organizer
?agent.
?agent rdfs:label ?ente} ORDER BY DESC(?numeroEventi)
Clicca qui per il risultato
Per chi invece volesse esplorare e navigare i dati, è disponibile l’apposita interfaccia di accesso che
consente un primo sguardo ai tre dataset già citati.
Le triple, al momento della pubblicazione di questa storia, sono 237.847, numeri destinati a salire perché la
catalogazione continua. In dettaglio, sono stati pubblicati 517 eventi, 221 luoghi e 13372 persone ed enti: la
base costruita con questi primi dataset, centrali e nevralgici per il lavoro di catalogazione, consentirà quindi
in futuro l’incremento con altri dataset della Fondazione, contribuendo ad arricchire la LOD Cloud con
nuova conoscenza.
Fabiana Guernaccini
[1] http://xmlns.com/foaf/spec/
[2] http://www.geonames.org/ontology/documentation.html
[4] https://www.w3.org/TR/skos-reference/
[5] https://www.dublincore.org/
[6] http://culturalis.org/eac-cpf/
[7] https://dati.beniculturali.it/cultural-ON/ITA.html
[8] https://dati.beniculturali.it/progetto-arco-architettura-della-conoscenza/