I browser sono quei software di tipo client (come ad
esempio Firefox) che interagendo con i server
web (come il progetto Open Source Apache) ci permettono di
visualizzare ed utilizzare il Web cosí come lo conosciamo;
i motori di ricerca sono interfacce web utilizzabili da
browser che ci permettono di semplificare l'accesso
all'informazione su Web interrogando poderosi basi di dati
che ci offrono una selezione di informazioni utili in
maniera ordinata. Browser e motori di ricerca condividono
analoghe incombenze di interazione con i server web dai
quali sono riconosciuti ed identificati attraverso una
stringa di codice testuale detta anche user agent
che a volte è determinante nel visualizzare od
interpretare in maniera diversa il Web ospitato sul server
di riferimento. Nello scambio dati fra client e server soprattutto per quanto riguarda
i browser gli http headers sono
file di testo importantissimo che includono - codifica dei caratteri, controllo della cache, ultima data di modifica, referrer ovvero
pagina di provenienza eccetera compresi i cookies
che registrano una serie di informazioni circa le navigazioni sul Web con
implicazioni delicate sul fronte della privacy ma di indubbia comodità
a livello funzionale. I motori di ricerca sono spesso integrati nei browser a livello di plugin,
come funzioni attivate direttamente nell'address url o attraverso moduli di ricerca
adiacenti alla address url principale. L'address url e la sua visibilità nel browser rimane dunque un importante
fattore di qualità nell'utilizzo di questi strumenti di navigazione del Web.
Ancora, browser e motori di ricerca rappresentano in qualche maniera le due facce, una umana e l'altra caratterizzata
dal funzionamento di automatismi, della ricerca di informazione in Rete: mentre i browser sono utilizzati dagli utenti finali (umani)
per comprendere l'informazione su Web e classificarla magari attraverso procedure di tagging e bookmarking,
gli spider (anch'essi browser ma governati da automatismi) vengono utili per indicizzare ed ordinare opportunamente la Rete di
informazioni che si dipana sul Web secondo precisi algoritmi matematici.
Per i browser si può parlare di esplorazione e navigazione di dati mentre per i motori di ricerca di attività di ricerca, appunto, su specifiche basi dati.
Browser
Il browser è uno strumento essenziale per la navigazione sul Web.
Il Web fa parte della più ampia rete di comunicazione Internet
composta da svariati servizi comunicativi caratterizzati tutti
da uno specifico protocollo (insieme di regole): tutti i servizi comunicativi
di Internet vengono erogati da specifici computer fornitori di servizi
denominati come server interrogati allo scopo da computer desiderosi di ricevere il
servizio attraverso specifici software che vengono denominati client e che
cercano il servizio sul server su determinati indirizzi specifici noti
anche come porte (ecco perchè per la comunicazione Internet si parla di modello client-server).
Tutti i computer per esistere e comunicare in Internet devono essere identificati
da un indirizzo detto anche numero IP
per comodità spesso tradotto in un indirizzo alfabetico
(attraverso il noto servizo DNS).
Molti servizi internet come ad esempio quello della posta elettronica o del
trasferimento file (ftp) sono erogati
solo attraverso una sessione di autenticazione (login)
durante la quale sono forniti nome utente e password.
Il browser è il software client che ottiene (senza autenticazione) dalla porta 80 del server Web
la possibilità di interagire con una pagina Web attraverso il
protocollo di comunicazione http.
Per poter interagire al meglio con una pagina Web è molto importante
avere piena consapevolezza di ciò che stiamo visualizzando ed utilizzando
ricordandosi di abilitare l'address bar del browser, avere accesso a
tutti i menù e funzionalità interne del browser magari prendendo dimestichezza
a tal scopo con le scorciatoie da tastiera utili, ad esempio, per una immediata
visualizzazione del codice sorgente E' importante ricordare che
a seconda dell'interfaccia hardware e software che abbiamo a disposizione
l'interazione con la pagina web può cambiare significativamente: un click destro del
mouse, ad esempio, può offrire possibilità diverse di interazione rispetto
ai diversi movimenti delle dita su un touchscreen a cominciare dalle funzionalità
visualizza sorgente ed analizza elemento.
Assolutamente importante prendere visione del codice sorgente di una pagina web:
il codice sorgente visualizzabile dal browser è il risultato (output)
dell'interazione client-server fra browser e server ed è il file di testo
dove è possibile capire l'origine della struttura, la formattazione
e gli script di funzionamento di una pagina Web.
In sintesi nel file sorgente di una pagina web è contenuto il
codice di marcatura html che
definisce la struttura di una pagina web, il
linguaggio di editing css che
ne determina la formattazione
e il linguaggio di scripting (javascript) che ne determina il
funzionamento in relazione
ai meccanismi di interazione con l'utente finale della pagina Web: salvare una pagina web in locale (file sorgente), modificare il file sorgente e verificare l'effetto delle modifiche è una ottima maniera per sperimentare il reale funzionamento del Web (esistno delle funzionalità insite nel browser come analizza elemento oppure plugin specifici di analisi del codice e del rendering di una pagina Web come il noto Firebug).
Se si considerano i tantissimi dispositivi di tipo diverso che
accedono al Web (console, smartphone, desktop, netbook, WebTv,
eccetera) si arriva facilmente alla conclusione che non
solo esistono tantissimi browser di tipo diverso ma anche
che è impossibile realizzare una pagina Web che venga
visualizzata alla stessa maniera da tutti i dispositivi e
conseguentemente da tutti i browser (è interessante notare come in alcune regioni geografiche ci sono massicce adozioni di browser di tipo drasticamente diverso da quelli universalmente noti). Diventa cosí
importante poter provare e testare la pagina Web su più
piattaforme possibili ed in mancanza di meglio su
simulatori ed emulatori delle medesime.
I computer desktop NON possono essere più considerati i privilegiati
interlocutori del Web e agli ormai imperanti smartphone e tablet si stanno
affiancando le soluzioni da salotto come le Web TV oppure
le consolle alla kinect con proprie funzionalità
e nuove interfacce di comando perlopiù basate su comandi vocali oppure
gesti del corpo o della mano.
Qualora non sia possibile testare un sito Web con i tantissimi
tipi diversi di browser esistenti al mondo (calcolate anche
le versioni diverse per i diversi sistemi operativi...) è
possibile avvalersi di specifici servizi di test messi liberamente
a disposizione per webmaster scrupolosi.
Possono essere considerati browser anche quei dispositivi che ci permettono di
accedere alla cosiddetta realtà aumentata ovvero alla realtà aumentata di informazioni
digitali peraltro perlopiù ricavabili in tempo reale dal Web stesso.
La realtà aumentata può ricavare informazioni dal nostro geoposizionamento, dalle immagini e dai suoni acquisibili dai nostri dispositivi digitali adempiendo ad esigenze comunicative così come di reperimento dell'informazione in base alla esperienza del nostro vissuto nell'ambiente reale.
E' importante tenere sempre presente le diverse possibilità di utilizzo offerte da
dispositivi come smartphone, tablet touchscreen e viceversa quelle a disposizione su computer veri e propri
con dispositivi di input completi (tastiere fisiche e mouse) riservando agli impegni
di tipo professionale il solo utilizzo di computer veri e propri che consentono
funzionalità di analisi e controllo realmente complete della comunicazione digitale di tipo Web.
Motori di ricerca
Il Web è comunemente inteso come lo spazio informativo e comunicativo
comunemente indicizzato dai motori di ricerca di utilizzo comune mentre per Deep Web si intende
la porzione del Web non indicizzato o non indicizzabile dai più noti motori di ricerca.
E' importante rendersi conto se ci si trova davanti ad una interfaccia
di ricerca che utilizza spider, database e algoritmo di un altro motore di ricerca
oppure di un vero e proprio motore di ricerca completo in ogni sua
parte (tecnologica e grafica) di soluzioni originali.
Un motore di ricerca può essere rappresentato come una interfaccia
alla quale è possibile sottoporre una query che
induce una ricerca in un data base strutturato
costituito da informazioni raccolte attraverso il lavoro
automatizzato di spider (detti anche crawler
o bot): il risultato della ricerca viene fornito
in maniera ordinata (ranking) sulla base di un
algoritmo matematico che tiene di conto delle
caratteristiche informative del sito Web visitato dallo
spider ma anche della sua ecologia di collegamenti con gli
altri siti Web esistenti su Internet (quest'ultima idea di un ricercatore italiano che
ha fatto la fortuna di Google consentendone il sorpasso su Altavista ed altri motori di ricerca affermatisi negli anni '90).
L'interfaccia grafica diventa quindi importante per conquistare l'attenzione dell'utente finale ma senza impegnarlo esageratamente: pensate alla semplicità dell'interfaccia di Google abbinata però all'idea fanstatica di modificare il proprio logo in un Doodle variabile a seconda dell'attualità. La base dati è altrettanto importante perchè consta delle informazioni (tante o poche raccolte dagli isntancabili spider, informazioni magari utili e originali oppure inutilmente duplicate) che possiamo interrogare.
L'ordinamento dei risultati è forse l'elemento più strategico perchè è il meccanismo che ci consente di filtrare e selezionare l'informazione che veramente ci interessa rispetto alla query espressa.
Esistono molti motori di ricerca nel mondo oltre ai
soliti noti che dominano il panorama nord-occidentale e
tutti risultano molto più complessi della struttura
relativamente semplificata di cui sopra proposta: ad esempio molti di
loro si integrano con il lavoro di redazioni umane che
sviluppano appositi alberi gerarchici informativi (directory)
il cui contenuto viene miscelato nelle risposte innescate
dalle interrogazioni svolte dall'utenza finale sui motori
di ricerca.
Vi sono poi motori di ricerca speciali (aggregatori)
capaci di indicizzare non il Web generico ma porzioni
specifiche di esso come le immagini, i suoni, i video, i
blog, eccetera. I motori di ricerca sono infatti sempre
più in grado di interpretare gli oggetti multimediali per
come sono realizzati affidandosi sempre meno alle
alternative testuali per la loro corretta interpretazione.
Alcuni motori di ricerca speciali, ad esempio, sono in grado
di realizzare ricerche di immagini partendo da una immagine
simile a quella che stiamo cercando, altri ancora miscelano
i risultati raccolti con la posizione geolocalizzata dell'utente che sta
svolgendo l'interrogazione sul motore di ricerca oppure con le attiità di ricerca informazione svolta precedentemente.
Quando si svolge una ricerca su un determinato argomento converrebbe esplicitare la ricerca su più canali informativi specifici, non fermandosi solo al Web generico ma indagando sull'ambito multimediale così come sui libri e documenti online, sui bookmark (segnalibri) scambiati fra utenti sull'argomento, sugli scambi comunicativi di tipo social, sulle novità dei blog magari estrapolabili tramite feed che ne sintetizzano il contenuto; vi possono poi essere delle ricerche con finalità molto specifiche come ad esempio quelle necessarie per individuare un nuovo brand ed allora tornano utili basi dati etimologiche, collezioni di nomi social e di domini Web nonchè elenchi di brevetti e marchi registrati.
Memoria digitale
La tecnologia digitale è naturalmente propensa a una
comoda e facile riproducibilità dell'informazione su supporti digitali
ma non a una inevitabile conservazione della medesima
a causa del decadimento di interoperabilità di supporti fisici (hardware) e
linguaggi (software).
I motori di ricerca sono uno degli strumenti principali
per cercare di affrontare un problema emergente che è
quello di salvaguardare la memoria collettiva ed
individuale di noi tutti attraverso meccanismi ripetuti di
riproducibilità nel tempo e nello spazio
(backup sincronizzati fra server di località diverse) che finiscono per essere una buona
strategia di conservazione.
Il problema infatti di un uso solo saltuario di formati
e standard aperti, l'estrema volatilità dell'informazione
digitale (facilmente riproducibile certo ma difficilmente
conservabile a lungo) fa sí che il nostro vissuto e
narrato sia a rischio di un inaspettato ma certo oblio.
Fortunatamente esistono molte iniziative accademiche ed
istituzionali ma anche associative e private (gli stessi
motori di ricerca) che stanno tentando di affrontare il
problema istituendo veri e propri archivi della conoscenza
sviluppati attraverso tecnologie interoperabili tra di
loro.
L'informazione digitale deve infatti essere considerata
facilmente riproducibile ma non necessariamente conservabile
a tempo indefinito dipendendo, la sua conservazione, dallo stato
di salute dei supporti digitali utilizzati ma anche
dalla capacità informatica di interrogare i medesimi (da qui
l'importanza di standard informatici aperti ed interoperabili
come il movimento del software libero).
Sarà interessante scoprire se avremo fisicamente la possibilità
di conservare tutta l'informazione digitale prodotta oppure
dovremmo necessariamente fare una selezione della medesima e se
questa selezione sarà affidata a redazioni umane come nel caso
delle directory oppure ad algoritmi come nel caso dei motori di ricerca.
Nel frattempo è importante prendere coscienza dei motori di ricerca che mettono a
disposizione un servizio di cache, dei motori di ricerca specializzati nella
conservazione di memorie digitali e visuali, delle pratiche esistenti di
deposito e validazione legale dei file digitali così come delle pagine Web e
soprattutto approfittare di tutte quelle procedure e comandi speciali messi a disposizione da
Google e compagnia come
che possono consentire quanto meno una collocazione storica della pagina Web
relativamente alla tempistica di indicizzazione del motore di ricerca in uso
così come a quelle pratiche di deposito e validazione magari supportati
da protocolli di sicurezza crittografici (per finalità, ad esempio, di firma digitale).