N.1 2019 - Valutare la biblioteca

Navigazione dei contenuti del fascicolo

Analizzare per innovare: uno studio sull’usabilità dei cataloghi Discovery NG con strumenti di web analytics

Camilla Fusetti

Comperio; camilla.fusetti@comperio.it

Enrico Tagliani

DGLine; enrico.tagliani@dgline.it

Per tutti i siti web l’ultima consultazione è stata effettuata il 3 aprile 2019.

Abstract

L’articolo intende presentare la metodologia, gli strumenti e i risultati di un lavoro di analisi sull’interazione tra OPAC e utenti. Nato dall’esigenza di raccogliere dati per studiare l’evoluzione del catalogo, il progetto ha previsto l’analisi dei comportamenti di oltre mezzo milione di utenti unici nell’arco di tre mesi, ricavando i dati dai portali di sette sistemi bibliotecari. Dopo le motivazioni di carattere teorico dell’indagine, vengono illustrati gli strumenti utilizzati, in particolare Google analytics per creare delle analisi personalizzate, Google spreadsheet per importare i dati e realizzare delle tabelle, e Google data studio per impostare una visualizzazione interattiva e facilitare l’esplorazione dei risultati. La metodologia di lavoro ha previsto l’uso di strumenti liberamente accessibili, e può essere facilmente replicata da quanti intendano analizzare e migliorare l’interazione con gli utenti. Infine, a partire dai dati raccolti, vengono proposte alcune possibili soluzioni riguardo le interfacce e la visualizzazione dei dati nei cataloghi.

I risultati del lavoro sono stati presentati al convegno “Comperio Data Blitz 2018”, grazie a un lavoro congiunto tra Comperio e la Rete bibliotecaria bresciana.

English abstract

The article presents methodology, tools and results of a systematic analysis on the interaction between catalogue and users. Born to study the catalogue evolution, the project involved half a million of unique users over a three-month period, obtaining data from seven library portals. After theoretical reasons for the investigation, the tools used are illustrated, in particular Google analytics to create customized analyzes, Google spreadsheet to import data, and Google data studio to create an interactive display and facilitate the exploration of results. The working methodology, based on free tools, can be easily replicated by those who intend to analyze and improve users’ interaction. Finally, starting from the collected data, some possible solutions regarding interfaces and data visualization are proposed.

The results were presented at the “Comperio Data Blitz 2018” conference, thanks to a joint work between Comperio and Rete bibliotecaria bresciana.

L’analisi dell’interazione tra utenti e cataloghi esposta in questo articolo nasce da un progetto di collaborazione tra la Rete bibliotecaria bresciana e Comperio, con lo scopo di raccogliere dati per ripensare le interfacce e le modalità di visualizzazione. Lo studio ha consentito di analizzare il comportamento di oltre mezzo milione di utenti unici, ed è stato condotto sui portali di sette sistemi bibliotecari che utilizzano il software Discovery NG.

I cataloghi delle biblioteche contengono molte tipologie di informazioni: eventi, servizi offerti, pagine personali degli utenti, proposte di lettura, sezioni specifiche, funzionalità di ricerca e descrizioni catalografiche. Tra questi vari aspetti l’analisi si è focalizzata principalmente sulla relazione tra gli utenti e gli elementi che consentono di ricercare, individuare ed esplorare le risorse. Il progetto di redesign dell’interfaccia ha infatti l’obiettivo di valorizzare i dati catalografici e di renderli più facilmente fruibili e comprensibili.

Questo approccio non ha la pretesa di fornire risultati esaustivi sull’usabilità e l’efficacia dei cataloghi, ma si configura come un primo passo per una successiva e più completa analisi qualitativa.

Misurare l’uso delle interfacce e la visualizzazione dei dati

Negli ultimi anni ci si è concentrati molto sulla struttura dei dati, sui modelli concettuali e sulle funzioni dei cataloghi. La Dichiarazione di Principi internazionali di catalogazione (ICP) è stata aggiornata e recentemente l’IFLA ha pubblicato IFLA Library Reference Model (IFLA LRM), in sostituzione ai Requisiti funzionali per i record bibliografici (FRBR). Si parla di Resource Description and Access (RDA) come nuovo standard di metadatazione e di BIBFRAME come modello di dati che possa sostituire i formati MARC. Alcune tecnologie del web semantico e l’idea di poter avere dati aperti strutturati e collegati, linked open data, hanno preso piede da diversi anni nella discussione sull’evoluzione dei dati catalografici. Si tratta però di struttura e di possibili funzioni dei dati, non di visualizzazione dei dati. Su questo argomento nel 2005 sono state pubblicate, sempre dall’IFLA, le Guidelines for OPAC displays, ma da allora non sono seguiti aggiornamenti. I cataloghi sono stati popolati da nuove tipologie di informazioni e nuove modalità di presentazione sono nate spontaneamente, promosse da singole istituzioni, da coordinamenti o da società di servizi informatici. Studi, approfondimenti e analisi statistiche possono aiutare a ripensare le interfacce e fornire lo stimolo per la nascita di un dibattito su questo specifico aspetto dei cataloghi.

Riguardo le analisi statistiche, la valutazione dell’usabilità è utile per avere un’idea misurabile delle problematiche che andranno risolte in fase di redesign, ma anche per colmare lo iato che si può creare tra i professionisti che sviluppano i sistemi e gli utenti che li utilizzano; la misurazione delle interazioni e del coinvolgimento si configura come un valido supporto nella progettazione di soluzioni basate sui reali bisogni delle persone. In particolare l’usabilità si focalizza sulla «misura in cui un prodotto può essere usato da specifici utenti per raggiungere specifici obiettivi con efficacia, efficienza e soddisfazione, in uno specifico contesto d’uso», mentre nella user experience (UX) prevale l’aspetto emotivo, contestuale e affettivo. Il progetto qui esposto si concentra sull’usabilità e si configura come un primo passo per una futura analisi qualitativa sulla UX.

Ci sono diversi metodi per analizzare l’usabilità di un catalogo: rilevazione dei dati di accesso, sondaggi, focus group, interviste, valutazioni condotte da esperti, confronto con modelli astratti di riferimento e osservazioni degli utenti. Gli strumenti di web analytics fanno parte dei metodi quantitativi per analizzare l’interazione tra le persone e un ambiente web; la Digital Analytics Association definisce questo sistema come «la misurazione, collezione, analisi e reportistica dei dati di internet con lo scopo di comprendere e ottimizzare l’utilizzo del web». Questo approccio consente di raccogliere molti dati velocemente, in modo semiautomatico e visualizzabili attraverso grafici o tabelle. Rispetto a test di usabilità di tipo qualitativo, generalmente basati sulla valutazione di un insieme di attività stabilite a priori dai bibliotecari o da esperti di UX, gli strumenti di web analytics offrono dati nativi relativamente all’attività degli utenti. Anche nell’ambito bibliotecario da diversi anni vengono impiegate queste tecniche. Gli strumenti a disposizione sono molteplici, ma per il progetto la scelta è ricaduta su Google analytics (GA) per i seguenti motivi:

  • consente di comprendere quali funzionalità vengono utilizzate e come vengono utilizzate, permette quindi di analizzare la navigazione all’interno di un catalogo;
  • è uno strumento sofisticato ma liberamente accessibile e la stessa analisi è replicabile anche da altri sistemi bibliotecari senza costi;
  • sono presenti diversi studi internazionali basati sull’utilizzo di Google analytics per testare l’usabilità dei cataloghi di biblioteca, con l’obiettivo di migliorare l’interfaccia utente.

Alcune indagini di questo tipo sono state fatte anche in Italia. Nel 2011 è stato condotto un primo test sull’utilizzo di Nilde, un servizio per migliorare l’interscambio dei documenti, si è trattato però di un sondaggio sottoposto a utenti e bibliotecari, e Google analytics è servito per misurare le visite alle pagine del sondaggio. Nel 2013 lo stesso strumento è stato usato per valutare gli accessi al sito Nilde World, al blog e al profilo Facebook, in questo caso è stato analizzato il numero di visualizzazioni di specifiche sezioni. Anche per il metaOPAC delle biblioteche di biblioteconomia è stato scelto GA per raccogliere dati sul numero di visitatori. Il Polo SBN dell’Università di Trieste e del Friuli Venezia Giulia ha condotto nel 2014 un’analisi sull’uso del nuovo OPAC, ricavando una parte dei dati con GA. Tra questi esempi l’unico in cui è stato valutato l’accesso a specifiche pagine e non solamente il numero totale di visitatori è l’analisi relativa a Nilde World, si tratta però di misurazioni che non riguardano il catalogo e i dati catalografici. La mancanza di approfondimenti recenti di questo tipo, basate su dati quantitativi, e la necessità di ripensare alcuni aspetti dei cataloghi, hanno fornito l’occasione per dare avvio al progetto. 

Metodologia e strumenti

Google analytics presenta un cruscotto con menù, percorsi e grafici preimpostati, per ricavare dati più specifici lo strumento può essere interrogato con delle application programming interface (API). In questo modo si possono ottenere risultati su larga scala, in breve tempo.

I dati raccolti con le API sono stati automaticamente importati utilizzando Google analytics spreadsheet add-on, un componente aggiuntivo presente nei fogli di calcolo di Google che permette di interrogare le API in modo semplificato, senza dover scrivere righe di codice. Con questa funzionalità si possono configurare molteplici chiamate, eseguirle contemporaneamente e ottenere i risultati direttamente nel foglio di calcolo (Fig. 1).

I dati così raccolti in Google spreadsheet sono stati confrontati e utilizzati come base per la creazione di visualizzazioni dinamiche ed esplorabili. L’ambiente interattivo è accessibile e le statistiche sono liberamente scaricabili. Anche in questo caso è stato scelto uno strumento messo a disposizione gratuitamente: Google data studio.

La prima fase dell’analisi può essere replicata senza troppe difficoltà, anche da chi non conosce i linguaggi di programmazione, perché è interamente basata sull’utilizzo di strumenti dotati di interfacce grafiche, facilmente comprensibili.

Per ottenere informazioni sull’uso di specifiche sezioni dei cataloghi le API di Google sono state interrogate tramite segmenti personalizzati, ovvero filtri e condizioni che permettono di analizzare il traffico web di alcune parti del sito, di ricavare informazioni sui comportamenti dell’utente o sulla dotazione tecnologica utilizzata. I segmenti possono essere costruiti inserendo nella specifica interfaccia di GA il tipo di pubblico e l’URL delle pagine prescelte.

L’arco temporale preso in considerazione è di 90 giorni, il periodo massimo esaminabile tramite i filtri personalizzati di GA. La prima rilevazione è stata condotta tra il 1 gennaio 2018 e il 31 marzo 2018. Altre rilevazioni sono state condotte nei trimestri successivi del 2018, confermando l’andamento dei risultati iniziali.

Su ogni portale sono state predisposte diverse misurazioni, tutte basate sul numero di utenti unici che hanno visitato particolari pagine dei cataloghi oppure effettuato specifiche operazioni di ricerca. Ciascun catalogo di sistema ha presentato diverse quantità di accessi, per cui, al fine di rendere le misurazioni confrontabili, si è scelto di rappresentare il valore percentuale.

Le rilevazioni sono state raggruppate in categorie e sottocategorie, creando degli ambiti tematici in cui fare ulteriori confronti, grazie all’uso di visualizzazioni grafiche. Ogni categoria è stata pensata per riflettere su questioni inerenti al comportamento degli utenti in un catalogo e iniziare a proporre interpretazioni a partire dai dati raccolti.

Figura 1

Tabella creata con l’API Google analytics spreadsheet add-on. Le colonne corrispondono ai diversi elementi analizzati nei portali, mentre le righe contengono i parametri utilizzati: “Report Name” indica il titolo del report; “View ID” è l’identificativo univoco del catalogo online collegato a GA; “Start Date” ed “End Date” riguardano il periodo temporale preso in considerazione; “Metrics” indica il tipo di misurazione quantitativa utilizzato; “Filters” consente di restringere i risultati aggiungendo delle specifiche (per esempio sulla dotazione tecnologica degli utenti); “Segments” indica i parametri usati per creare un sottoinsieme di dati e analizzare specifiche pagine o azioni, in particolare viene richiamato l’identificativo del segmento creato in GA.

Risultati

L’analisi è stata condotta seguendo la struttura del catalogo, partendo dalle sezioni presenti nella pagina principale per arrivare poi a funzioni più specifiche, come l’uso delle faccette (o filtri) e la visualizzazione delle notizie.

Panoramica generale

Le misurazioni sono state raggruppate in cinque categorie che a loro volta comprendono dei segmenti, ossia specifiche pagine o funzionalità:

  • aree comuni del portale: comprende le vetrine e i percorsi creati nella home page, gli ambienti dedicati alla community, gli eventi inseriti, le pagine relative alle singole biblioteche, MyDiscovery ovvero l’area personale degli utenti e la sezione dedicata all’aiuto e ai suggerimenti;
  • funzioni di ricerca: riguarda le tipologie di ricerca fatte dagli utenti all’interno di un portale;
  • visualizzazione notizie: categoria relativa a quanti utenti unici hanno visualizzato un record bibliografico in forma estesa da diversi punti del catalogo;
  • faccette: categoria che misura quanti utenti unici hanno interagito con questi filtri per raffinare una ricerca o navigare nel catalogo;
  • accessi dalle notizie: misura quanti utenti unici hanno navigato utilizzando i punti di accesso controllati dei record bibliografici.

La media dei risultati, visibile nella Fig. 2, mostra come all’interno di un catalogo le funzioni di ricerca rappresentino l’azione prevalente compiuta dagli utenti.

L’atto di ricercare attraverso le apposite stringhe prevale su altri comportamenti, come l’esplorazione delle sezioni, la visualizzazione degli eventi, i raffinamenti possibili e la navigazione tra descrizioni. È interessante notare inoltre lo scarto tra la ricerca (46,46%) e la visualizzazione estesa delle descrizioni (33,53%), alcuni utenti probabilmente non hanno bisogno di cliccare sulla notizia e visionarla perché le informazioni essenziali, come le azioni di prenotazione e gli elementi che identificano la risorsa, sono già presenti nella forma sintetica dei record (Fig. 3).

La ricerca mostra che, in un catalogo così strutturato, gli utenti navigano preferendo le faccette (Fig. 4) ai dati di autorità presenti nella visualizzazione estesa delle notizie.

Figura 2 Panoramica di utilizzo delle principali aree e funzioni analizzate
Figura 3 Visualizzazione sintetica di un record bibliografico
Figura 4 Faccette per filtrare una ricerca

Utilizzo delle aree comuni del portale

Tra le aree comuni del catalogo (Fig. 5) spicca l’uso dell’ambiente personale MyDiscovery, che consente di gestire le prenotazioni, di visualizzare i prestiti in corso, le proposte d’acquisto, le ricerche e i contatti con la biblioteca. La possibilità per gli utenti di operare in modo autonomo e da remoto risulta una funzione chiave e imprescindibile del catalogo. La seconda sezione più visitata riguarda le singole pagine delle biblioteche, nelle quali ogni istituzione generalmente inserisce gli orari e le informazioni sui principali servizi. Questo comportamento è riconducibile al fatto che gli utenti cercano informazioni sulle biblioteche partendo dai motori di ricerca, che presentano tra i risultati le pagine delle singole biblioteche contenute nei portali. L’area della Community, costituita da un forum dove gli utenti possono interagire e lasciare commenti, risulta la meno utilizzata.

Figura 5 Aree comuni dei portali Discovery NG

Funzioni di ricerca

L’analisi sulle funzioni di ricerca conferma la preferenza per la ricerca semplice rispetto a quella avanzata (Fig. 6), anche in biblioteche di conservazione. L’idea che la ricerca avanzata parli la lingua del catalogatore e risulti poco funzionale agli utenti viene ampiamente riconfermata dai dati.

Figura 6 Funzioni di ricerca

Faccette

La navigazione a faccette è una caratteristica degli OPAC di nuova generazione, i cosiddetti discovery tool, che consentono di cercare e successivamente raffinare tramite questi filtri. Le faccette rappresentano categorie relative agli oggetti descritti in un catalogo; ogni categoria contiene al suo interno ulteriori suddivisioni o raggruppamenti di dati, cliccando di volta in volta sui vari elementi l’utente può creare un sottoinsieme sempre più specifico di risorse. Durante l’identificazione degli elementi da analizzare si è ritenuto importante anche questo aspetto del catalogo, non risultano infatti documenti ufficiali o standard che stabiliscano quali debbano essere le faccette in un catalogo. Si tratta di elementi personalizzabili in base alle esigenze delle istituzioni. La Fig. 7 mostra la percentuale di utilizzo per categoria di faccetta, la sequenza del grafico ripropone l’ordine delle faccette, visibile nei cataloghi dall’alto verso il basso. Il filtro “biblioteche”, l’elemento più utilizzato, consente di selezionare le risorse in base alla biblioteca di gestione, ovvero la biblioteca dove l’utente vuole fisicamente prendere in prestito o consultare l’oggetto. Questa elemento indica che un catalogo così strutturato è utilizzato per cercare principalmente risorse fisiche, gestite e rese fruibili dalle biblioteche. Se il catalogo offrisse un numero maggiore di risorse accessibili online probabilmente questo elemento non sarebbe preminente. Lo scarso uso della faccetta “livello bibliografico” è facilmente spiegabile con la difficoltà di comprendere i termini catalografici che lo popolano. Monografia, collezioni, seriali e analitici non sono termini comunemente noti per indicare ad esempio una rivista, un libro o un film.

Va specificato che l’elemento “altre edizioni” è stato inserito in questa area di analisi pur non rientrando nelle faccette. Si tratta di una funzionalità presente nella visualizzazione delle notizie (Fig. 8), che consente di arrivare a tutte le manifestazioni caratterizzate da stesso titolo e stesso autore.

Questa forma di raggruppamento e individuazione presenta più accessi di altri filtri, pur trattandosi di percentuali basse (1,91%), soprattutto se si considera che è visibile solamente cliccando sulla descrizione bibliografica e quindi successivamente alle faccette.

Nelle interfacce web la posizione fornisce valore e visibilità agli elementi, a livello di layout vale generalmente l’indicazione “primo è meglio”, ragion per cui ci si aspetterebbe che ciò che viene mostrato in alto, o prima rispetto a una sequenza di passaggi, presenti un maggior numero di accessi. Questa affermazione viene confermata e allo stesso tempo smentita dai dati. Da una parte l’uso del filtro “target”, che indica il pubblico di riferimento della risorsa descritta, conferma la teoria dell’organizzazione percettiva, per cui nei sistemi che lo posizionano in fondo alla pagina troviamo una percentuale d’uso dell’1,37% (Fig. 7), mentre in un portale che lo presenta tra le prime scelte la percentuale sale al 2,41% (Fig. 9). Al contrario l’elemento “soggetto” rivela percentuali simili anche in posizioni diverse: in fondo alla lista delle faccette ha una percentuale d’uso del 2,19%, all’inizio dei filtri del 2,34% (sempre Fig. 7 e 9).

Figura 7 Utilizzo delle faccette nei portali

La sequenza degli elementi riprende la disposizione grafica, dall’alto verso il basso, presente nella maggior parte dei cataloghi analizzati.

Figura 8 Funzionalità “altre edizioni”
Figura 9 Utilizzo delle faccette nella Rete bibliotecaria bresciana e cremonese con un diverso posizionamento dei filtri

Navigazione attraverso gli accessi controllati delle notizie

Un utente, dopo aver individuato la descrizione bibliografica di interesse, può cliccare sulla notizia, visionare le informazioni complete e muoversi tra le entità del catalogo selezionando i punti di accesso controllati. Questa tipologia di navigazione risulta però tra le funzionalità meno utilizzate. In particolare gli elementi meno compresi sono le classi e le opere (Fig. 10), situazione riconducibile anche al gergo tecnico utilizzato.

Inoltre si può osservare che le etichette dei legami non esprimono un’azione: visualizzare l’etichetta “nomi” indica all’utente che cliccando può arrivare a tutte le risorse collegate a quel nome? L’etichetta “soggetti” indica l’azione del visionare tutte le risorse che trattano di quel soggetto?

Figura 10 Navigazione tramite gli accessi controllati delle notizie

Comportamento rispetto alla visualizzazione delle notizie

Infine è stata fatta un’analisi sul comportamento degli utenti (Fig. 11) per capire i movimenti, all’interno di un catalogo, che hanno come punto di arrivo descrizioni bibliografiche complete. Sono state individuate tre opzioni relative a questi percorsi:

  1. utenti che arrivano a visualizzare una notizia partendo dalla ricerca semplice;
  2. utenti che arrivano a visualizzare una notizia partendo dalla ricerca avanzata;
  3. utenti che arrivano a visualizzare una notizia partendo dalla home page.

Il dato, in qualche modo anomalo, riguarda la bassissima percentuale di persone che visualizzano notizie partendo da qualsiasi punto della home page, escludendo quindi le due modalità classiche di ricerca. Questo significa che le vetrine predisposte dai bibliotecari vengono raramente utilizzate dagli utenti, e che tale tipo di suggerimento, proposto in questa modalità, va forse ripensato.

Figura 11 Comportamento rispetto alla visualizzazione delle notizie

Discussione e conclusioni

Lo studio ha fornito una base verificabile per cominciare a ipotizzare modifiche e migliorie. Con la consapevolezza dei limiti insiti in un’analisi di tipo quantitativo, l’idea di esporre i risultati è nata non solo per condividere un metodo replicabile e automatizzabile, ma anche per stimolare un dibattito e un confronto sul tema della visualizzazione dei dati e del loro utilizzo.

Ricerca e faccette

Riguardo la modalità di ricerca avanzata è chiaro che gli elementi catalografici, riproposti esattamente come si presentano a un catalogatore, non sono funzionali per trovare le risorse. Diverse strade sono percorribili in questo senso: tecnologie di elaborazione del linguaggio naturale consentirebbero agli utenti di formulare ricerche più agevolmente, di porre per esempio domande al catalogo. Spetterebbe poi a questi strumenti di analisi e comprensione la mediazione tra il linguaggio naturale e quello tecnico e controllato della catalogazione. L’utente potrebbe “avvicinarsi” alle funzionalità più avanzate anche attraverso interfacce dinamiche, che presentino possibilità di interazione diverse a seconda del contesto di ricerca. Ad esempio rispetto alla ricerca basata sulla stringa “Assassinio sull’Orient Express”, un’interfaccia di questo tipo potrebbe presentare in prima battuta la scelta tra tipologie di risorse (film, libri, fumetti ecc.), per poi scendere nel dettaglio, ponendo l’utente di fronte a nuove opzioni più specifiche. La selezione di “film” porterebbe a una lista di versioni cinematografiche tra cui scegliere, visualizzando in prima battuta i migliori candidati alla prenotazione o all’accesso, nel caso di oggetto digitali.

Un altro sviluppo possibile riguarda le faccette. L’analisi ha confermato che alcuni filtri non vengono quasi mai utilizzati. Questo è riconducibile a due cause: gli elementi non sono utili o comprensibili, gli elementi non sono posizionati in modo strategico. I dati ricavati ci hanno portato a ipotizzare lo sviluppo di faccette dinamiche. Un elemento di suddivisione è utile quando presenta al suo interno diversi dati selezionabili, più questo numero aumenta più l’elemento diventa utile. Se per esempio la ricerca “Pinocchio di Collodi” presentasse nella faccetta “lingua” quattro elementi e nella faccetta “target” un solo elemento, la prima faccetta avrebbe una ricaduta maggiore sulla possibilità di raffinare la ricerca e avrebbe quindi più peso. Un sistema dinamico modificherebbe la posizione delle faccette in base al numero di elementi in esse contenute, diventerebbero sostanzialmente delle faccette rilevanti. Anche la funzione di raggruppamento dovrebbe essere potenziata nei Discovery NG: non più visualizzazione di manifestazioni ma cluster di notizie accorpate in modo automatico sulla base di indicatori variabili, per esempio lingua, supporto, titolo e responsabilità principale. Questi raggruppamenti anticipano l’atto di filtrare con le faccette, presentano una visione semplificata di ciò che è disponibile e possono avere una ricaduta qualitativa e quantitativa sul tempo impiegato dagli utenti per individuare le risorse utili. Le principali funzioni sugli oggetti (prenotazione, aggiunta a una lista ecc.) dovrebbero però essere mantenute anche a questo livello, altrimenti si rischierebbe di imporre troppi passaggi per arrivare alla risorsa ricercata. La presentazione di opere o espressioni, anche attraverso procedimenti di associazione automatica tra le diverse manifestazioni, può essere utile nel momento in cui non richiede agli utenti un numero eccessivo di interazioni.

Lingua del catalogo

In questi anni, nonostante si sia continuamente ribadita la necessità di parlare la lingua degli utenti, molto poco è stato fatto a livello di denominazione degli elementi catalografici; nei cataloghi, in particolare italiani, è ancora difficile individuare banalmente un e-book, un fumetto, un film o un documentario. Una risorsa elettronica remota potrebbe essere un libro, un articolo, una fotografia, un sito o una canzone. Per esempio l’indicazione catalografica “monografia-materiale proiettabile e video” a cosa si riferisce? Si tratta di un film, di una serie TV, di un documentario, di un corso di formazione? Si potrebbe asserire ragionevolmente che queste specificazioni sono presenti in più punti della descrizione catalografica, che possiamo desumere molte informazioni e ricostruire la natura e il genere di una risorsa mettendo insieme diversi dati, raffinando la ricerca con le faccette o con gli elementi della ricerca avanzata; tuttavia non possiamo pensare che un percorso così macchinoso sia facilmente intuibile dagli utenti. Come risposta a una ricerca generica il catalogo dovrebbe mostrare in modo chiaro tutto ciò che offre, presentando le principali nature degli oggetti, così come ricercati dalle persone. Ancora oggi molti portali di biblioteca presentano ambienti diversi per le risorse digitali e per quelle fisiche. La mancanza di una visione complessiva e di una rete di relazioni coerente, tra tutti gli oggetti descritti, ha una ricaduta sulla qualità dei servizi offerti e sul tempo impiegato per trovare risposte ai propri bisogni informativi. La realtà complessiva dei servizi offerti da una biblioteca comprende sia gli oggetti alla quale si fornisce solamente l’accesso sia gli oggetti fisici posseduti, questa unità dovrebbe tradursi in una maggiore integrazione e coerenza tra strumenti, interfacce, descrizioni e dati.

Navigazione e visualizzazione dei dati catalografici

La ricerca ha mostrato che pochissimi utenti visualizzano la descrizione completa delle risorse. Probabilmente perché le principali funzioni che consentono di agire sull’oggetto sono già presenti nella forma sintetica del record. Ma come considerare tutti i dati inseriti dai catalogatori e non visibili nelle faccette? Si pensi ad esempio agli elementi codificati che vengono inseriti in modo molto analitico, come le indicazioni sulle tecniche di produzione, sulle partiture musicali o sull’Area 0 delle ISBD (solo per citarne alcune, ma si tratta di moltissime informazioni). Alcuni di questi dati sono indicizzati, ciò significa che inserendo quei termini in una stringa di ricerca semplice è possibile arrivare alla descrizione che li contiene, ma come li contiene e dove? Se un utente cercasse a testo libero “film in bianco e nero” troverebbe risorse che contengono quei termini nei titoli propri, nelle collane, negli abstract, nei soggetti o nei dati codificati. Un tale rumore nelle risposte non può che creare frustrazione, incidendo sul tempo impiegato. Perché allora non ragionare su sistemi intelligenti che comprendano e interpretino le varie tipologie di richieste informative? Senza pretendere che gli utenti capiscano il nostro linguaggio. Ciò detto va precisato che le descrizioni catalografiche arricchite e corredate di dati anche analitici non sono assolutamente inutili; al contrario, per cominciare a predisporre operazioni di data mining, estrarre informazioni a partire da grandi quantità di dati e pensare a sistemi più vicini al linguaggio degli utenti, è necessario avere elementi qualificati e di qualità. I dati, in particolare quelli inseriti in forma codificata e gli elementi di autorità, sono necessari per offrire risposte più espressive, per consentire percorsi di navigazione più flessibili, per rappresentare nel modo più completo i contenuti semantici veicolati dagli oggetti. La soluzione al mancato utilizzo della ricerca avanzata non è quella di appiattire la descrizione, ma di valorizzare queste informazioni con modalità più funzionali per gli utenti.

Un altro aspetto importante riguarda le vetrine create nelle home page dei cataloghi, nella maggior parte dei casi si tratta delle novità o di raggruppamenti tematici predisposti dai bibliotecari. L’analisi ha rivelato che la maggior parte degli utenti non utilizza questi suggerimenti per arrivare alle descrizioni e che, a livello quantitativo, il punto di partenza per arrivare a visualizzare un record è quasi sempre la stringa di ricerca semplice. Servirebbero studi qualitativi più approfonditi, ma presentazioni così generiche possono risultare lontane dagli interessi specifici degli utenti. Una visualizzazione basata su algoritmi più sofisticati, in seguito a una prima ricerca o al login, potrebbe mostrare descrizioni più pertinenti.

La navigazione tra le entità del catalogo, a partire dai punti di accesso controllati presenti nelle notizie, è la funzione meno utilizzata. Questo risultato non stupisce considerando che pochissimi utenti arrivano a visualizzare l’intero record. Restano comunque elementi fondamentali, che consentono di individuare le risorse più appropriate e che, negli ordinamenti basati sulla rilevanza, hanno generalmente un peso maggiore rispetto ad altre tipologie di informazioni catalografiche. I punti di accesso controllati (nomi, titoli, classi, soggetti, generi) sono quasi tutti presentati nelle faccette, ed è in questa posizione che vengono più usati dagli utenti. Tra gli elementi esclusi dai filtri vi sono le relazioni tra opere, visibili nei cataloghi DNG cliccando sul titolo dell’opera. Riguardo la gestione dei cataloghi l’utilità dell’opera è indubbia: consente di propagare i dati alle manifestazioni, di fare operazioni massive di manutenzione e arricchimento delle notizie. Questa entità può costituire il riferimento per la creazione di visualizzazione raggruppate di notizie e fungere da collegamento tra descrizioni di ambienti diversi, per esempio tra risorse di una biblioteca digitale e risorse fisiche. Lato utente invece questo strato alto del catalogo, sottoposto a rigorosi lavori di controllo, non è pienamente valorizzato. Le relazioni tra opere costituiscono elementi informativi importanti e di livello concettuale, che consentono di fornire chiavi di approfondimento. L’opera “Pinocchio” di Collodi ha relazioni con i vari film, fumetti, con le riduzioni, con materiale grafico, e tutto ciò può esprimersi in varie lingue, per diversi target e in diversi supporti. Offrire, attraverso una visualizzazione grafica intuitiva, le informazioni contenute nel reticolo concettuale delle opere potrebbe rientrare tra le modalità di suggerimento dei cataloghi. Non solo quindi suggerimenti basati sulla profilazione degli utenti ma anche suggerimenti basati sui dati catalografici e sulle loro relazioni intrinseche. Nell’ambito delle interfacce, come si è visto, la posizione è un elemento strategico, e la riprogettazione dei cataloghi deve tener conto anche di questo aspetto nel ripensamento del layout dei dati. Dove mostrare le relazioni tra opere dal momento che gli utenti non arrivano quasi mai al record completo? Non abbiamo una risposta definitiva, ma riteniamo che una soluzione potrebbe essere la presentazione di questi suggerimenti nella parte alta del catalogo. Si tratterebbe di anticipare ciò che ora è visibile cliccando sul titolo uniforme e di inserirlo in una posizione rilevante.

Conclusioni

Lo scopo di questo studio era quello di misurare l’usabilità dei cataloghi Discovery NG per ripensare le interfacce e la visualizzazione degli elementi catalografici. I dati raccolti hanno mostrato i punti di forza e le debolezze di questi sistemi.

La ricerca semplice e l’area personale, che consente di operare da remoto, si sono rivelati elementi irrinunciabili. La scarsa usabilità della ricerca avanzata potrebbe essere migliorata integrando tecnologie di elaborazione del linguaggio naturale, in questo modo gli utenti otterrebbero risposte pertinenti e precise, usando un singolo box di ricerca, e potendo così esprimere in modo più agevole i propri bisogni informativi. Inoltre un simile processo di trattamento automatico del linguaggio naturale valorizzerebbe la grande quantità di dati, presenti nei cataloghi in forma codificata e strutturata. Le faccette potrebbero basarsi sulla rilevanza ed essere dinamiche, ovvero modificare la propria posizione in base al loro numero di occorrenze. Meriterebbe un maggiore approfondimento la questione relativa alla visualizzazione delle opere e delle loro relazioni, si tratta di elementi di autorità previsti dalle norme catalografiche e dai modelli concettuali di riferimento; in molti casi sono dati presenti nei cataloghi ma non pienamente valorizzati. Posizionare queste ricche informazioni in un punto alto delle pagine potrebbe migliorare la loro usabilità.

Questi sono solo alcuni dei possibili sviluppi legati ai cataloghi; certamente servirebbero studi più approfonditi per capire cosa vogliono davvero gli utenti che cercano informazioni attraverso sistemi di mediazione, cosa si aspettano e quali sono le dinamiche con cui ricercano e navigano. L’evoluzione dei cataloghi dovrebbe partire dai reali bisogni informativi delle persone, anche riprendendo in mano vecchi problemi non risolti, e dalla progettazione di tecnologie che possano durare e non abbiano solamente un impatto temporaneo.