netzapping banner

  Come ti indago
l'Internet italiana

 

di Vittorio Pasteris

Vittorio Pasteris Sesto Potere intervista Giovanni Montana, l'autore della più citata ricerca sull'uso di Internet in Italia. Nell'intervista il giovane esperto di Internet palermitano parla della sua esperienza, proponendo interessanti consigli per i gestori di siti web italiani

L'avvento di Internet ha messo in evidenza la creatività di nuovi personaggi, spuntati spesso quasi dal nulla, che si sono "messi in rete" dimostrando la loro capacità di costruire qualcosa di veramente nuovo.

Uno di questi é Giovanni Montana, ventitreenne palermitano, laureando in Scienze Statistiche ed Economiche presso la facoltà di Economia dell'Università di Palermo. Giovanni é stato l'autore di una ottima ricerca sulla demografia di Internet in Italia disponibile presso il sito infostat.mediatel.it.

Come ti e' nata l'idea di fare un lavoro sulla Rete ?
Da anni mi interesso di informatica ed in passato ho realizzato alcuni programmi gestionali per professionisti. Ho poi iniziato ad interessarmi ad Internet quando in Italia esistevano solo pochissimi punti di accesso, tutti geograficamente molto distanti.
In un primo tempo ho seguito l'evoluzione della Rete solo tramite la carta stampata e le riviste del settore. Poi un giorno, ho letto di una ricerca realizzata nel 1994 da James Pitkov che indagava principalmente sulle caratteristiche demografiche degli utenti: era la prima indagine statistica on-line svolta con l'utilizzo di un questionario in HTML posto sul Web.

Una volta collegato ad Internet, ho cercato di comprenderne le sue limitazioni metodologiche in campo statistico, consultando vari altri lavori svolti in maniera più o meno analoga. Ho anche verificato approfonditamente quale fosse la situazione in Italia riguardo alle indagini sugli utenti del Web, contattando molte società di ricerca.

L'opportunità di sperimentare una nuova metodologia di inchiesta on-line, insieme all'esigenza sempre più sentita e condivisa da società e operatori del settore di disporre di dati aggiornati sulla nascente utenza di Internet in Italia, ha giustificato l'avvio della ricerca, che è partita nell'Aprile del 1996.

Giovanni Montana ha sfruttato con grande intelligenza la Rete e per cercare un partner per la sua ricerca ha pensato bene di risalire tutta la penisola italiana, per approdare all'estremo opposto dello stivale: a Trieste.

Come hai trovato i tuoi partner?
In questo tipo di indagini on-line la quantità di risposte dipende principalmente dal livello di conoscenza dellíindagine tra gli utenti della Rete. Il modo più diretto per far conoscere líinchiesta e per invitare gli utenti alla partecipazione, consiste fondamentalmente nella diffusione capillare di links in quanti più siti Web. Al limite, se in tutti i siti fosse presente e ben visibile un collegamento al questionario, líutente verrebbe a conoscenza dellíindagine qualunque sia il tipo di percorso ipertestuale da lui realizzato.

Per questo motivo la scelta del sito Web in cui pubblicare il questionario dipendeva dalla necessità che il sito avrebbe dovuto essere ìad alto trafficoî e che fosse già linkato in molti altri siti.Dato che líobiettivo di indagine verso cui si era inizialmente orientati riguardava la rilevazione di alcuni caratteri non su tutti gli utenti italiani del Web, ma solo relativamente ad una sotto popolazione di essi, gli utenti interessati allíutilizzo dei servizi bancari on-line, la scelta del sito è ricaduta sulla Nuova Banca di Credito di Trieste, già presente in molti motori di ricerca e con centinaia di links già attivati verso di essa.

Ho contattato via e-mail il webmaster della banca, Miran Pecenik, e la collaborazione si è avviata sin da quel primo messaggio. Per la totale mancanza di dati aggiornati sullíutenza italiana, si è poi deciso di ampliare la rilevazione a tutti gli utenti arrivati fino al sito perché interessati alle informazioni in esso contenute. In questo modo si è così deciso di utilizzare la presenza su Internet della banca come supporto per uníindagine di carattere più ampio, senza peraltro che tale scelta gravasse sui costi di rilevazione.

Successivamente lo sforzo principale è stato destinato alla diffusione dellíiniziativa su segmenti di utenza con interessi molto diversi, in modo da mettere potenzialmente al corrente dellíinchiesta, tutti gli utenti italiani del Web e facendoli confluire verso il sito ospitante líiniziativa. Per questo motivo una fase determinante del lavoro è stata dedicata alla sensibilizzazione di molti gestori di siti italiani così che pubblicassero volontariamente un collegamento al questionario.

Per pubblicizzare la ricerca e ottenere link da altri siti avete scelto di spedire messaggi via e-mail a molti destinatari. Come avete scelto gli indirizzi e come vi siete comportati per evitare problemi eventuali di netiquette ?
Il ruolo della diffusione della notizia, data la natura volontaristica dellíinclusione degli utenti nel campione, ci è parso essere determinante. La promozione di uníinchiesta sul Web è però una fase complessa da realizzare. La principale difficoltà deriva dal fatto che, così come non esiste nessuna lista degli utenti, non è disponibile nessun elenco unico di tutti i siti italiani completo di indirizzo e-mail al quale inviare la richiesta di collaborazione. La soluzione scelta, quella che abbiamo ritenuta ottimale, seppur difficoltosa, è stata quella di utilizzare alcune liste di URL di vari siti italiani, collegarsi singolarmente ad ognuno di essi e ricercare di volta in volta, allíinterno delle pagine, l'indirizzo di e-mail del webmaster del sito per inviargli un messaggio.
Abbiamo preferito iniziare utilizzando una lista di siti del GARR con 805 siti commerciali. Poi abbiamo preso in considerazione altri elenchi minori, tra cui líarchivio dei providers italiani, varie liste contenenti gli URL di molte riviste on-line, reti civiche, scuole ed università, nonché vari siti ritenuti particolarmente interessanti ed aventi, presumibilmente, uníaudiencemolto variegata.

Terminata così la lunga fase di ricerca degli indirizzi di e-mail, la richiesta di collaborazione allíindagine è stata inviata a 700 siti commerciali, 240 internet providers, 27 reti civiche, 4 mailing list italiane sottoscritte da circa 1400 utenti, 77 redazioni di testate del settore e non, 51 scuole ed istituiti superiori ed infine vari dipartimenti di tutte le università italiane.

I messaggi sono sempre stati inviati singolarmente, con ognuno di essi contenente líesatta intestazione del destinatario, partendo dalla convinzione che la confidenzialità del messaggio avrebbe potuto far ottenere un maggior livello di collaborazione.

Chi ti ha maggiormente aiutato per riuscire a concludere il lavoro?
A parte il continuo sostegno da parte del mio relatore, il prof. Lovison, devo ricordare l' aiuto di tre persone in particolare.
Miran Pecenik, della Nuova Banca di Credito di Trieste, che ha creduto in questa iniziativa sin dal primo messaggio inviatogli nell' aprile del 1996. Dalle discussioni con lui è nata anche líidea del servizio gratuito da offrire come incentivo alla partecipazione. Nellíideazione di questo servizio si è cercato di ideare qualcosa che permettesse anche di verificare líautenticità, e quindi líunicità, del rispondente. La soluzione ottimale per soddisfare queste necessità è sembrata essere quella di presentare un servizio gratuito di aggiornamento su determinati argomenti a scelta dellíutente.
Il bene ìinformazioneî, personalizzabile secondo le preferenze di ognuno, è apparsa come uníofferta neutra e tale da non creare distorsioni. Gli effetti sembrano essere stati davvero confortanti: lí80% circa di tutti i rispondenti ha infatti lasciato il proprio indirizzo e-mail.

Giovanni Vullo, della Mediatel, mi ha poi fornito un aiuto essenziale sia nel reperimento degli indirizzi e-mail da contattare per la pubblicizzazione sia nella realizzazione del software per la post elaborazione dei dati.

Carmelo Saraceno, consulente della ACNielsen in Italia, mi ha messo a disposizione alcune variabili sui domini italiani rilevati tramite líindagine ìNASA Web Sitesî e che si sono rivelati estremamente utili per una maggiore comprensione dei dati raccolti.

Com'e' stato fatto lo scrutinio delle form compilate ?
Ancor prima dello scrutinio vero e proprio, subito dopo la raccolta, è stata realizzata una post elaborazione dei dati per averli in un formato diverso. La struttura del file generato dalla CGI era formata di record successivi che potevano anche riferirsi allo stesso visitatore che, durante la medesima visita, avesse inoltrato più richieste o nella consultazione del questionario o in tentativi di invio errati
In questa fase sono state introdotte anche delle altre variabili (tempo di compilazione, eventuale tempo di lettura del comunicato stampa) e si sono poi realizzati una serie di programmi per delle ulteriori pre elaborazioni sui dati.
Le analisi vere e proprie sui dati sono poi state realizzate con dei pacchetti statistici professionali.

Le rilevazioni statistiche via Internet hanno secondo te un significato scientifico ?
Senza alcun dubbio sì, anche se in realtà un giudizio del genere dipende da cosa si intende per significato scientifico. Se ci si riferisce alla possibilit‡ di avere un campione probabilistico di utenti, quindi alla possibilità di poter generalizzare i risultati ottenuti allíintera popolazione (utenti e non utenti), allora le indagini on-line, intese come strumento di ìestrazioneî del campione, non offrono questa possibilità. Sono solo uno strumento di indagine esplorativa, altrettanto utile, ma mirato ad un utilizzo diverso.
Questo tipo di inchieste hanno comunque tutta una serie di caratteristiche che le rendono senzíaltro interessanti e spesso vengono utilizzate in maniera complementare rispetto ad indagini sugli utenti svolte secondo metodologie più tradizionali. Eí facile rendersi conto che la popolazione osservabile tramite il Web coincide esattamente con il target a cui si è interessati.
Come strumento di ìrilevazioneî, poi, il questionario in HTML presenta delle caratteristiche uniche e senzíaltro migliori rispetto al telefono e alla tecniche ad esso relative.

Le tecniche di campionamento ed analisi dei dati vanno riviste con queste metodologie mediate dalla Rete ?
In realtà non è applicabile nessuna specifica tecnica di campionamento per questo tipo di indagini on-line. Gli utenti non vengono estratti secondo schemi probabilistici, sono essi stessi che decidono di collaborare e nessun controllo a priori viene usualmente fatto sulla dimensione del campione utilizzato.

Campioni di questo genere sono statisticamente detti ìnon probabilisticiî ed è proprio questo aspetto che limita la generalizzabilità dei risultati, non líauto selezione, che è invece comune a quasi tutte le inchieste in cui i soggetti sono liberi, pur essendo stati contattati, di non partecipare. La natura digitale delle informazioni e le tecniche di rilevazione automatica dei dati su Internet potranno però essere impiegate con profitto sempre maggiore. Le tecniche di analisi, invece, sono quelle usuali e variano in funzione al tipo di dati con cui il ricercatore decide di lavorare.

La demografia di Internet della realtà italiana si presenta molto diversa da quella statunitense?
Devo premettere che il confronto tra i dati demografici degli utenti va fatto con molta cautela, non solo per le diversità strutturali, sociali ed economiche, ma soprattutto per il modo in cui le varie indagini vengono realizzate. Anche la presunta ìrappresentativitàî, che spesso si pensa caratterizzi le indagini svolte tradizionalmente, deve sempre passare al vaglio di uníattenta analisi. Poi in molti studi svolti nel mondo che ho analizzato, ho visto solo pochi accenni alla metodologia adottata, al tasso di risposta, alla precisione delle stime fornite.

Prescindendo da tutto questo e riferendomi strettamente ai numeri, il profilo dell'utente italiano sembra essere piuttosto simile a quello statunitense sotto vari aspetti ed anche il tasso di crescita si evolve secondo un trend analogo, sebbene le dimensioni del fenomeno restano ancora diverse. Attualmente sto portando a termine l'elaborazione di questi confronti che presto inserirò, così come altri risultati, sul sito Web.

Ma gli interessi statistici e di analisi di Giovanni Montana si sono spostati anche al di là di quello che riguarda la demografia della Rete, cercando di comprendere come valutare oggettivamente altri aspetti dell'economia digitale.

Esiste un metodo più o meno oggettivo per valutare l'audience di un sito ?
Sì, un metodo esiste e consiste nellíanalisi dei log files, cioè degli archivi generati dai server Web in cui sono impresse tutte le richieste pervenute da parte degli utenti del sito: con degli strumenti di analisi appropriati un webmaster può conoscere con precisione le modalità di utilizzo del suo sito.

Bisogna però distinguere la possibilità di valutare líaudience di un sito dalla necessità di ìconfrontareî líaudience di più siti, diversi tra loro per contenuti, per struttura ipertestuale, ecc. I log files danno la possibilità, seppur con tutta una serie di limitazioni, di conoscere la composizione dell'audience rispetto ad alcuni parametri che però non sono identici per tutti i siti.

Gli hits non possono essere che un parametro grossolano. Cosa si può utilizzare in loro alternativa ?
Il numero di hits è un parametro grossolano in quanto dipende essenzialmente dal numero di elementi che compongono le pagine Web e che quindi possono variare enormemente da sito in sito. Eí importante notare che il numero di hits varia anche in funzione delle modalità di navigazione dellíutente.

Ogni hit corrisponde infatti ad una singola richiesta effettuata da un utente, indifferentemente, una pagina HTML, un grafico o un file di qualsiasi altro tipo. Se un utente visita una pagina HTML comprensiva di 5 grafici, per esempio, vengono generati usualmente 6 hits, ma può verificarsi il caso in cui alcune componenti della pagina siano già presenti nella cache del browser dellíutente, così che il loro numero potrebbe essere ridotto. Molti navigatori preferiscono poi non caricare automaticamente i grafici per velocizzare il collegamento ed in questo caso il numero di hits richiesti viene ulteriormente limitato.

Hoffman e Novak, due professori di marketing alla Vanderbilt University, hanno affermato che spesso il numero di hits generati da un sito viene reso noto perchè particolarmente elevato, giusto per mostrare un parametro che possa in qualche modo impressionare o fare notizia, ma che in fondo ha un significato molto limitato.

Cosa usare dunque? Líapproccio tentato da molte società è stato quello di creare del software tale che possa individuare le singole ìvisiteî, ovvero un sequenza di hits riconducibili ad uno stesso utente durante la medesima sessione. Líideale è però quello di lavorare con líunità elementare ìutenteî, quindi identificare univocamente tutti i distinti soggetti che frequentano i siti.

Dato che e' piuttosto semplice "barare" e' auspicabile un controllo formale sui dati elaborati o si rischia di impazzire fra controllati e controllori ?
Le possibilità di "gonfiare" gli accessi sono molte. Oltre a riportare il reale numero di hits che pur non essendo stato contraffatto è comunque un dato privo di un chiaro significato, è poi possibile cambiare le carte in tavola e modificare i dati. La presenza di terze parti indipendenti che verifichino la natura dei dati forniti sarà quindi necessaria.

I sistemi di conta on-line, tipo webcounter hanno un senso e un futuro ?
Hanno senso solo se i conteggi vengono interpretati per quello che realmente rappresentano: il numero di volte in cui una pagina è stata richiesta e non il numero di singoli utenti che líhanno vista. Probabilmente in futuro sarà possibile enumerare i visitatori piuttosto che le pagine ed allora questi sistemi avranno molta più validità.

E' meglio valutare la quantità o la qualità degli accessi ?
Sarebbe ottimale valutare entrambi gli aspetti congiuntamente, anche le due metodologie presentano delle difficoltà diverse che crescono passando dalla misurazione quantitativa a quella qualitativa. Per la migliore diffusione di un messaggio pubblicitario occorre usualmente scegliere il mixdi canali più idonei a raggiungere il maggior numero di potenziali acquirenti.

Con riferimento a questo obiettivo la prima esigenza è sicuramente quella di quantificare líaudience, cioè il numero di persone che i vari canali, dunque i diversi siti Web, consentono di raggiungere in un prefissato periodo di tempo. Líottenimento di dati simili sul Web può essere teoricamente realizzabile in maniera totalmente trasparente allíutente e indipendentemente da una sua esplicita collaborazione. Altri aspetti, quali le caratteristiche demografiche, psicografiche, comportamentali, ecc., altrettanto importanti, implicano invece un approccio di ricerca diverso.

Qual'è il valore dell'utilizzo dei log dei siti Web ? Quali sono i parametri più importanti ?
I settori in cui líanalisi dei log files può servire sono diversi: possono avere valore nella scelta delle strategie di marketing, in ambito pubblicitario, come guida nella creazione delle pagine Web, per una più produttiva disseminazione di informazioni on-line.

In ogni caso bisogna capire che tipo di informazioni servono realmente e quale dettaglio si desidera ottenere. I parametri più importanti sono quindi da correlare agli obiettivi: in certi casi può essere utile analizzare le ìsequenzeî con le quali le pagine vengono richieste, e presumibilmente lette; quindi il percorso di ogni utente con i relativi tempi di permanenza. In altri casi possono bastare degli indici diversi come il numero di volte in cui un certo banner è stato selezionato.

Per le applicazioni più tecniche si può anche prescindere dai contenuti delle pagine, mentre in altri casi è determinante interpretare le preferenze degli utenti costruendo degli indicatori basati su dei parametri che tengano conto del modo in cui le varie informazioni sono presentate. In alcuni studi, per esempio, è stata stimata la relazione tra la frequenza del collegamento e la durata della visita e sulla base di questa stima si è poi segmentata líaudience. In altri casi sono stati anche utilizzati dei modelli psicologici per cercare di comprendere il comportamento degli utenti.

L'uso dei log files puó violare la privacy ?
Quello del rispetto della privacy è un argomento che sembra essere molto sentito dagli ìinternautiî ed è emerso anche dallíindagine on-line. Utilizzando le ìvisiteî o i ìdominiî come unità elementare non credo comunque che ci sia alcun rischio di invasione della privacy.

Le aziende americane come usano strategicamente le elaborazioni sui log ? Le aziende italiane fanno lo stesso?
Certo, molte società utilizzano l'analisi dei log files principalmente per migliorare líofferta di informazioni e líusabilità dellíinterfaccia grafica. Tra le tante, la Xerox, per esempio, ha promosso uno studio dei log files per realizzare un modello statistico che permetta di prevedere gli spostamenti nel sito e di segmentare líutenza.

Un altro utilizzo che mi è sembrato molto interessante è quello relativo alla creazione di ìlink dinamiciî, cioè di collegamenti ipertestuali che, a differenza di quelli statici usualmente posizionati nella pagine Web, vengono mostrati allíutente in base al suo percorso tra le pagine. Per esempio, in un ìmercato virtualeî, uníelaborazione on-line dei log file può individuare le preferenze dellíutente in base al tipo di pagine richieste e mostrare in tempo reale i link più opportuni, anche sotto forma di banners.

Per quanto riguarda la situazione italiana, da uníindagine molto informale e non strutturata ho potuto constatare che molte società italiane con presenza in Rete utilizzano semplicemente il software che conteggia gli hits. Questo permette di tracciare un primo profilo dei loro utilizzatori, ma non ho dati precisi relativi ad un utilizzo strategico di questi archivi.

E' meglio usare i log files o creare dei cookies localmente ?
Le informazioni ottenibili con le due tecniche possono essere considerate complementari. I cookiesdicono esattamente chi ha realizzato un certo tragitto ipertestuale mentre i log files, opportunamente elaborati, possono fornire con maggior precisione il come. Ovviamente attraverso i cookies è possibile salvare dei dati personali come per esempio le pagine preferite in un sito, così che nelle visite successive il server possa leggere tali preferenze e soddisfare meglio e subito le esigenze dellíutente.

In altri casi i cookies sono stati utilizzati come ìcarrello della spesaî: in alcuni siti commerciali è infatti possibile ordinare articoli o servizi attraverso una lista che viene poi salvata nei cookies,così che se la sezione di acquisto dovesse essere interrotta, si può successivamente ricontinuare con gli acquisti senza dover ricominciare tutto daccapo.

In alcuni mercati virtuali i cookies vengono quindi utilizzati come strumento di marketing per seguire i clienti nei loro acquisti successivi e, in altri casi ancora, viene usato come metodo per non dover richiedere allíutente di inserire ad ogni sua visita il proprio codice di accesso, per esempio sul sito del New York Times, in quanto viene registrato uní unica volta direttamente sul computer dell'utente.

maggio 1997


  Questo sito è ospitato da ALPCOM