Browser e Motori di Ricerca

I browser interagendo con i server web ci permettono di visualizzare e utilizzare il Web cosí come lo conosciamo; i motori di ricerca ci permettono d'interrogare poderosi basi di dati che ci offrono una selezione d'informazioni utili in maniera efficacemente ordinata: ri-pensa all'evoluzione dell'Inclusive Design provando il brivido di visitare con il tuo browser un sito Web non più esistente (?) interrogando il data base Archive.org THE FACEBOOK.

Browser

Browser e motori di ricerca condividono analoghe incombenze d'interazione con i server web dai quali sono riconosciuti e identificati attraverso una stringa di codice testuale detta anche !User Agent che a volte è determinante nel visualizzare o interpretare in maniera diversa il Web ospitato sul server di riferimento. Nello scambio dati fra client e server soprattutto per quanto riguarda i browser gli !http headers sono file di testo importantissimo che includono - codifica dei caratteri, controllo della !cache, ultima data di modifica, !referrer ovvero pagina di provenienza eccetera compresi i !cookies che registrano una serie d'informazioni circa le navigazioni sul Web con implicazioni delicate sul fronte della #privacy ma d'indubbia comodità a livello funzionale. I motori di ricerca sono spesso integrati nei browser a livello di plugin, come funzioni attivate direttamente nell'!address url o attraverso moduli di ricerca adiacenti alla address url principale. L'address url e la sua visibilità nel browser rimane dunque un importante fattore di qualità nell'utilizzo di questi strumenti di navigazione del Web che pure possono conoscere, ad esempio grazie ai QR Code, possibili alternativi meccanismi di navigazione e conseguenti UX soprattutto tramite smart-devices.

Ancora, browser e motori di ricerca rappresentano in qualche maniera le due facce, una umana e l'altra caratterizzata dal funzionamento di automatismi, della ricerca d'informazione in Rete: mentre i browser sono utilizzati dagli utenti finali (umani) per comprendere l'informazione su Web e classificarla magari attraverso procedure di !tagging e !bookmarking, gli spider (anch'essi browser ma governati da automatismi e detti anche bot oppure crawler) vengono utili per indicizzare e ordinare opportunamente la Rete d'informazioni che si dipana sul Web secondo precisi !algoritmi matematici. Per i browser si può parlare di esplorazione e navigazione di dati mentre per i motori di ricerca di attività di ricerca, appunto, su specifiche basi dati: la differenza a livello di !UX non è banale perché puo voler dire subire l'effetto !filter bubble sui social ovvero essere circondati di relazioni e informazioni comode e prevedibili sia per l'utente che per l'ambiente social che lo ospita così come decidere autonomamente - grazie ai motori di ricerca - quale patrimonio informativo a cui accedere attraverso l'opportuna !parola chiave Abracadabra. Il meccanismo del filter bubble può incidere non solo a livello individuale nei meccanismi di navigazione ma anche a livelli più profondi e importanti e soprattutto di livello collettivo considerando come l'attuale !narrazione orale di tipo social può inficiare meccanismi di preservazione della memoria collettiva fino a mettere in dubbio asserite verità di tipo storiche (che per essere tali necessitano di processi collettivi di maturazione del dibattito sociale). Il !browser è uno strumento essenziale per la navigazione sul Web. Il Web fa parte della più ampia rete di comunicazione Internet composta da svariati servizi comunicativi caratterizzati tutti da uno specifico protocollo (insieme di regole): tutti i servizi comunicativi d'Internet vengono erogati da specifici computer fornitori di servizi denominati come server interrogati allo scopo da computer desiderosi di ricevere il servizio attraverso specifici software che vengono denominati client e che cercano il servizio sul server su determinati indirizzi specifici noti anche come porte (ecco perché per la comunicazione Internet si parla di modello client-server). Tutti i computer per esistere e comunicare in Internet devono essere identificati da un indirizzo detto anche numero IP per comodità spesso tradotto in un indirizzo alfabetico (attraverso il noto servizo DNS). Molti servizi internet come ad esempio quello della posta elettronica o del trasferimento file (ftp) sono erogati solo attraverso una sessione di autenticazione (login) durante la quale sono forniti nome utente e password. Il browser è il software client che ottiene (senza autenticazione) dalla porta 80 del server Web la possibilità d'interagire con una pagina Web attraverso il protocollo di comunicazione http. Per poter interagire al meglio con una pagina Web è molto importante avere piena consapevolezza di ciò che stiamo facendo ricordandosi di abilitare l'!address bar del browser, avere accesso a tutti i menù e funzionalità interne del browser magari prendendo dimestichezza a tal scopo con le scorciatoie da tastiera utili (ad esempio CTRL o CMD + U per una immediata visualizzazione del codice sorgente). Un click destro del mouse può offrire possibilità diverse d'interazione a cominciare dalle funzionalità !visualizza sorgente ed !analizza elemento. Il codice sorgente visualizzabile dal browser è il risultato (output) dell'interazione client-server fra browser e server ed è il file di testo dove è possibile capire l'origine della struttura, la formattazione e gli script di funzionamento di una pagina Web. In sintesi nel file sorgente di una pagina web è contenuto il codice di marcatura html che definisce la struttura di una pagina web, il linguaggio di editing css che ne determina la formattazione e il linguaggio di scripting (javascript) che ne determina il funzionamento in relazione ai meccanismi d'interazione con l'utente finale della pagina Web: salvare una pagina web in locale (file sorgente), modificare il file sorgente e verificare l'effetto delle modifiche è una ottima maniera per sperimentare il reale funzionamento del Web (esistono allo scopo delle funzionalità insite nel browser come analizza-ispeziona elemento per analisi del codice e del rendering di una pagina Web dopo lo sviluppo del cosiddetto DOM - Document Object Model. Se si considerano i tantissimi dispositivi di tipo diverso che accedono al Web (console, smartphone, desktop, netbook, WebTv, eccetera) si arriva facilmente alla conclusione che non solo esistono tantissimi browser di tipo diverso ma anche che è impossibile realizzare una pagina Web che venga visualizzata alla stessa maniera da tutti i dispositivi e conseguentemente da tutti i browser (è interessante notare come in alcune regioni geografiche ci sono massicce adozioni di browser di tipo drasticamente diverso da quelli universalmente noti). Diventa cosí importante poter provare e testare la pagina Web su più piattaforme possibili e in mancanza di meglio su simulatori ed emulatori delle medesime. I computer desktop NON possono essere più considerati i privilegiati interlocutori del Web e agli ormai imperanti smartphone e tablet si stanno affiancando le soluzioni da salotto come le Web TV oppure le consolle alla kinect con proprie funzionalità e nuove interfacce di comando perlopiù basate su comandi vocali oppure gesti del corpo o della mano. Qualora non sia possibile testare un sito Web con i tantissimi tipi diversi di browser esistenti al mondo è possibile avere una percezione affidabile del rendering su altri dispositivi e browser modificando il proprio user agent ad esempio attraverso User Agent Switcher. In ogni caso è consigliabile prendere in considerazione i seguenti browser: Firefox per la sua natura Open Source garanzia di sicurezza e interoperabilità; Chrome per la sua ampia offerta di tool di analisi Web; Opera molto interessante per il suo motore di rendering proprietario per il javascript e per le sue innumerevoli e funzionali soluzioni d'interfaccia utente; Brave per le sue opzioni avanzate di protezione della privacy e ad-blocking.

MOTORI DI RICERCA

Il Web è comunemente inteso come lo spazio informativo e comunicativo accessibile tramite browser e indicizzato dai motori di ricerca sempre più AI supported (ma con opportuni distingui fra machine learning generativi e motori di ricerca e con la possibilità, da parte dei motori di ricerca, di bloccare l'indicizzazione delle AI attraverso appositi robots.txt) e sempre più in relazione con i social network. È importante rendersi conto se ci si trova davanti ad una interfaccia di ricerca che utilizza !spider, !database e !algoritmo di un altro motore di ricerca oppure ad un vero e proprio motore di ricerca completo in ogni sua parte (tecnologica e grafica) di soluzioni originali. Un motore di ricerca può essere rappresentato come una interfaccia alla quale è possibile sottoporre una !query (ultimamente definite anche come entità sotto un profilo semantico) che induce una ricerca in un data base strutturato costituito da informazioni raccolte attraverso il lavoro automatizzato di spider (detti anche crawler o bot). Il risultato della ricerca viene fornito in maniera ordinata (ranking in inglese) sulla base di un algoritmo matematico che tiene di conto delle caratteristiche informative del sito Web visitato dallo spider (in primis la quantità e la qualità dei contenuti) ma anche della sua ecologia di collegamenti con gli altri siti Web esistenti su Internet (quest'ultima idea del ricercatore italiano Marchiori che, col suo hypersearch, ha fatto la fortuna di Google consentendone il sorpasso su Altavista e altri motori di ricerca affermatisi negli anni '90 come ad esempio Yahoo! integrato poi da Bing). È importante sapere come presentare le informazioni ai motori di ricerca in termini di meta-descrizioni ma è altrettanto prendere atto che gli algoritmi sono sempre più in grado, attraverso anche meccanismi di !pattern recognition, d'interpretare e addirittura imparare a interpretare (!machine learning) schemi molto complessi di dati ed ancor più se hanno grandi moli di dati ovvero !Big Data a disposizione. Ovviamente, per facilitare questi meccanismi è necessario rapportarsi a questi veri e propri strumenti di !A.I. sottoponendo informazione - sia essa in forma vocale, visuale o scritta - nella maniera più chiara e comprensibile possibile. L'interfaccia grafica è importante per conquistare l'attenzione dell'utente finale ma senza impegnarlo esageratamente: pensate alla semplicità dell'interfaccia di Google abbinata però all'idea fantastica di modificare il proprio logo in un doodle variabile a seconda dell'attualità. La base dati è altrettanto importante perché consta delle informazioni (tante o poche raccolte dagli instancabili spider, informazioni magari utili e originali oppure inutilmente duplicate) che possiamo interrogare. L'ordinamento dei risultati è forse l'elemento più strategico perché è il meccanismo che ci consente di filtrare e selezionare l'informazione che veramente ci interessa rispetto alla query espressa. La !query può essere espressa in maniera diretta - magari conoscendo sintassi e opzioni di ricerca oppure attraverso l'interfaccia di modalità avanzata di ricerca. Oltre alla modalità avanzata di ricerca e ai conseguenti comandi di ricerca è utile fare conoscenza dei principali canali di ricerca offerti da Google oltre al Web generico e in particolare con il canale immagini.

In alternativa è interessante susufruire delle ricerche di brave search che ha grande attenzione alla questione della privacy e funzioni molto articolate come quella di localizzazione, che può essere annullata (la ricerca diventa 'globale') oppure cambiata simulando la ricerca da altri paesi.

RICERCHE SPECIALI

Vi sono poi !motori di ricerca speciali e aggregatori capaci d'indicizzare non il Web generico ma porzioni specifiche di esso come le immagini, i suoni, i video, i blog, eccetera: fra tutti merita citare necessariamente quella fantastica raccolta d'immagini, testi e suoni del patrimonio culturale raccolto e digitalizzato da 'europei' e che corrisponde al nome di Europeana che, come altri, mette a disposizione molto materiale di tipo Creative Commons. I motori di ricerca sono inoltre sempre più in grado d'interpretare gli oggetti multimediali per come sono realizzati anche se testo (e alternative testuali) così come i meta-dati rimangano i riferimenti principali per una corretta interpretazione e indicizzazione. Alcuni motori di ricerca speciali, ad esempio, sono in grado di realizzare Reverse Image Search partendo da una immagine simile a quella che stiamo cercando, altri ancora miscelano i risultati raccolti con la posizione geolocalizzata dell'utente che sta svolgendo l'interrogazione sul motore di ricerca oppure con le attività di ricerca informazione svolta precedentemente. Quando si svolge una ricerca su un determinato argomento converrebbe esplicitare la ricerca su più canali informativi specifici, non fermandosi solo al Web generico ma indagando sull'ambito multimediale - suoni compresi. Vi possono poi essere delle ricerche con finalità molto specifiche come ad esempio quelle necessarie per individuare un nuovo brand e allora tornano utili basi dati etimologiche, collezioni di nomi social e di domini Web nonchè ricerche nei database di marchi registrati. Sempre in tema di brand molto utile YouGov Profiles Lite per esplorare tratti demografici, interessi, abitudine comunicative di un audience e il corrispondente Brand Index Lite per studiare il rendimento dei brand di tutto il mondo. Altri ancora, molto particolari, consentono di effettuare ricerche molto precise su basi dati scientifiche oppure offrono la possibilità di verificare contenuti eventualmente duplicati su altri siti Web. Per gli smanettoni e amanti del codice sorgente delle pagine web publicWWW mentre per coloro che cercano ispirazioni in tema layout ed utilizzo dei colori Muzli Search. Qualsiasi sia il motore di ricerca che ci troviamo di fronte è sempre importante andare a indagare la sua modalità di !advanced search con i !search commands. Infine ricordarsi sempre che chi ama lo studio deve approfittare della possibilità di frequentare le biblioteche alla ricerca di libri ma anche di ebook.

AD EST DI GOOGLE

Ad Oriente c'è un fiorire di motori di ricerca che riescano a contrastare il predominio di Google e Bing (assoluto nell'area nord-occidentale) come ad esempio il sud-coreano Naver, Baidu e sogou per la Cina, Yandex per la aree russofone.

Memoria digitale

La questione della memoria digitale è una problematica complessa che nasce dall'obsolescenza dei supporti hardware stimabile in moli casi in poco più di dieci anni di durata: i formati software possono viceversa avere vita anche più lunga ma non indeterminata soprattutto se si ragiona di accesso e fruibilità di software proprietario (il !software libero, viceversa, è per sua definizione interoperabile a tempo indeterminato). Per risolvere questa problematica della conservazione del digitale oltre a una serie di competenze diffuse preziosissime per il restauro di hardware obsoleto esistono numerosi standard internazionali come il noto Open Archival Information System nonché iniziative locali per la preservazione degli strumenti di comunicazione. L'informazione digitale deve essere infatti considerata facilmente riproducibile ma non necessariamente conservabile a tempo indefinito: la teoria della conservazione deve prendere in considerazione lo stato di salute dei supporti digitali utilizzati ma anche la capacità informatica di elaborare i medesimi da cui l'importanza di standard informatici aperti e interoperabili e del movimento del !software libero e formati di file esistenti che garantiscano non solo l'accesso da parte dell'utenza ma la piena funzionalità delle interfacce relativamente alla sostenibilità dei formati stessi maggiormente garantita a lungo termine dai file facenti riferimento alla tipologia FOSS per la loro caratteristica di standard aperto: !ExifTool permette di visualizzare e metadati, DROId, come esplicita l'acronimo, consente d'identificare la natura dei file esaminati, !XENA facilita la conversione di file in formati aperti, !ARCHIVEMATICA è una una suite integrata di strumenti open source che consente di archiviare oggetti digitali secondo il modello funzionale !OAIS. Ma quali sono gli ambiti applicativi specifici per l'archiviazione del Web?

Moltissimi strumenti software utili per la conservazione della memoria digitale sul Web ruotano intorno all'apposito standard WARC utilizzato ad esempio da molti !offline browser capaci di scaricare e archiviare interi siti Web come il popolare HTTrack Website Copier che ha un proprio standard di archiviazione ma che può essere convertito nel formato arc tramite il tool httrack2arc sviluppato dall'attivissimo servizio di conservazione digitale portoghese ARQUIVO.PT (standard peraltro adottati anche da altri progetti di archiviazione come quello inglese oppure il Pandora australiano). La questione dei formati di file è peraltro centrale e quindi risultano utili strumenti come ExifTool per il trattamento dei meta dati (fondamentali per descrivere e catalogare la risorsa da archiviare) ma ancor prima tool come "Digital Record Object IDentification" (DROID) utili per l'identificazione del formato dei file ed eventuale loro conversione in formati standard e adatti per la preservazione a lungo termine. cache:www.infoaccessibile.com è una query di esempio che consente di visualizzare la pagina Web nelle sue versioni passate ed archiviate nella cache di motori di ricerca che possano funzionare anche come validazione delle pagine Web (o di altre tipologie di file digitali tramite sistemi crittografici di firma digitale). L'iniziativa più autorevole e utile a livello internazionale per la salvaguardia a lungo termine di file multimediali è il noto e autorevole portale di conservazione digitale Archive che offre la possibilità di accedere e scaricare varie tipologie di opere digitali (dai film ai videogiochi) così come di poter creare delle collezioni private di opere da salvaguardare nel tempo. In Italia deposito legale è finalizzata a salvaguardare nel tempo pubblicazioni digitali quali tesi di dottorato.

Webrecorder offre una serie di tool utili che consentono di archiviare in formati standard siti web mentre si navigano con appositi browser per registrare un'esperienza utente sul Web comprensiva di evenutali sessioni di login (pensate all'esperienza utente social) che peraltro rappresentano delle vere e proprie barriere all'archiviazione per le procedure di offline-browser essendo quest'ultime in grado di salvare solo ciò che è pubblicamente accessibile senza pratiche di autenticazione. Molti social network offrono procedure di backup di pagine e account così come di poter nominare altri account "eredi digitali" mentre i motori di ricerca consentono esportazioni similari come nel caso del servizio !Google Takeout.

La tematica della memoria digitale si trova in molte interfacce digitali a cominciare dalla funzione 'altre date' in Google Maps in modalità Street View: è il caso dei graffiti conservati a futura memoria da graffyard tramite apposizione di QR-Code (anche quando cancellati dai muri come nel caso del percorso Bambina Precoce n. 8 - 1985 di !street art ideato su Wikitude) oppure i libri cartacei che possono tovare nuove forme e nuove opportunità di condivisione (digitali) grazie al movimento !hacker dei DIY book scanner. Particolarmente intrigante la possibilità di acquisire libri in forma di immagine tramite quel fantastico connubio di meccanica-falegnameria-ottica-elettronica che è il !bookscanner da trasformare in fase di post-produzione tramite apposito software ad hoc come ScanTailor in immagini tif e quindi in file pdf tramite altro software specifico come gscan2pdf per renderli infine accessibili tramite i portentosi servizi di !Archive comprensivi anche di opzione ocr per la loro trasformazione in testo vero (e comunque possibile anche con software specifico come OCRFeeder).

Vai direttamente ai contenuti

Browser e Motori di Ricerca

RICERCHE SPECIALI

AD EST DI GOOGLE