Vai direttamente ai contenuti
sezioneparole chiave !Abracadabra per accedere al digitale

Browser e Motori di Ricerca

I browser interagendo con i server web ci permettono di visualizzare e utilizzare il Web cosí come lo conosciamo; i motori di ricerca ci permettono d'interrogare poderosi basi di dati che ci offrono una selezione d'informazioni utili in maniera efficacemente ordinata: ri-pensa all'evoluzione dell'Inclusive Design provando il brivido di visitare con il tuo browser un sito Web non più esistente (?) interrogando il data base Archive.org THE FACEBOOK.

MOTORI DI RICERCA

Il Web è comunemente inteso come lo spazio informativo e comunicativo accessibile tramite browser e indicizzato dai motori di ricerca sempre più AI supported (ma con opportuni distingui fra machine learning generativi e motori di ricerca e con la possibilità, da parte dei motori di ricerca, di bloccare l'indicizzazione delle AI attraverso appositi robots.txt) e sempre più in relazione con i social network. È importante rendersi conto se ci si trova davanti ad una interfaccia di ricerca che utilizza !spider, !database e !algoritmo di un altro motore di ricerca oppure ad un vero e proprio motore di ricerca completo in ogni sua parte (tecnologica e grafica) di soluzioni originali. Un motore di ricerca può essere rappresentato come una interfaccia alla quale è possibile sottoporre una !query (ultimamente definite anche come entità sotto un profilo semantico) che induce una ricerca in un data base strutturato costituito da informazioni raccolte attraverso il lavoro automatizzato di spider (detti anche crawler o bot). Il risultato della ricerca viene fornito in maniera ordinata (ranking in inglese) sulla base di un algoritmo matematico che tiene di conto delle caratteristiche informative del sito Web visitato dallo spider (in primis la quantità e la qualità dei contenuti) ma anche della sua ecologia di collegamenti con gli altri siti Web esistenti su Internet (quest'ultima idea del ricercatore italiano Marchiori che, col suo hypersearch, ha fatto la fortuna di Google consentendone il sorpasso su Altavista e altri motori di ricerca affermatisi negli anni '90 come ad esempio Yahoo! integrato poi da Bing). È importante sapere come presentare le informazioni ai motori di ricerca in termini di meta-descrizioni ma è altrettanto prendere atto che gli algoritmi sono sempre più in grado, attraverso anche meccanismi di !pattern recognition, d'interpretare e addirittura imparare a interpretare (!machine learning) schemi molto complessi di dati ed ancor più se hanno grandi moli di dati ovvero !Big Data a disposizione. Ovviamente, per facilitare questi meccanismi è necessario rapportarsi a questi veri e propri strumenti di !A.I. sottoponendo informazione - sia essa in forma vocale, visuale o scritta - nella maniera più chiara e comprensibile possibile. L'interfaccia grafica è importante per conquistare l'attenzione dell'utente finale ma senza impegnarlo esageratamente: pensate alla semplicità dell'interfaccia di Google abbinata però all'idea fantastica di modificare il proprio logo in un doodle variabile a seconda dell'attualità. La base dati è altrettanto importante perché consta delle informazioni (tante o poche raccolte dagli instancabili spider, informazioni magari utili e originali oppure inutilmente duplicate) che possiamo interrogare. L'ordinamento dei risultati è forse l'elemento più strategico perché è il meccanismo che ci consente di filtrare e selezionare l'informazione che veramente ci interessa rispetto alla query espressa. La !query può essere espressa in maniera diretta - magari conoscendo sintassi e opzioni di ricerca oppure attraverso l'interfaccia di modalità avanzata di ricerca. Oltre alla modalità avanzata di ricerca e ai conseguenti comandi di ricerca è utile fare conoscenza dei principali canali di ricerca offerti da Google oltre al Web generico e in particolare con il canale immagini.

In alternativa è interessante susufruire delle ricerche di brave search che ha grande attenzione alla questione della privacy e funzioni molto articolate come quella di localizzazione, che può essere annullata (la ricerca diventa 'globale') oppure cambiata simulando la ricerca da altri paesi.

RICERCHE SPECIALI

Vi sono poi !motori di ricerca speciali e aggregatori capaci d'indicizzare non il Web generico ma porzioni specifiche di esso come le immagini, i suoni, i video, i blog, eccetera: fra tutti merita citare necessariamente quella fantastica raccolta d'immagini, testi e suoni del patrimonio culturale raccolto e digitalizzato da 'europei' e che corrisponde al nome di Europeana che, come altri, mette a disposizione molto materiale di tipo Creative Commons. I motori di ricerca sono inoltre sempre più in grado d'interpretare gli oggetti multimediali per come sono realizzati anche se testo (e alternative testuali) così come i meta-dati rimangano i riferimenti principali per una corretta interpretazione e indicizzazione. Alcuni motori di ricerca speciali, ad esempio, sono in grado di realizzare Reverse Image Search partendo da una immagine simile a quella che stiamo cercando, altri ancora miscelano i risultati raccolti con la posizione geolocalizzata dell'utente che sta svolgendo l'interrogazione sul motore di ricerca oppure con le attività di ricerca informazione svolta precedentemente. Quando si svolge una ricerca su un determinato argomento converrebbe esplicitare la ricerca su più canali informativi specifici, non fermandosi solo al Web generico ma indagando sull'ambito multimediale - suoni compresi. Vi possono poi essere delle ricerche con finalità molto specifiche come ad esempio quelle necessarie per individuare un nuovo brand e allora tornano utili basi dati etimologiche, collezioni di nomi social e di domini Web nonchè ricerche nei database di marchi registrati. Sempre in tema di brand molto utile YouGov Profiles Lite per esplorare tratti demografici, interessi, abitudine comunicative di un audience e il corrispondente Brand Index Lite per studiare il rendimento dei brand di tutto il mondo. Altri ancora, molto particolari, consentono di effettuare ricerche molto precise su basi dati scientifiche oppure offrono la possibilità di verificare contenuti eventualmente duplicati su altri siti Web. Per gli smanettoni e amanti del codice sorgente delle pagine web publicWWW mentre per coloro che cercano ispirazioni in tema layout ed utilizzo dei colori Muzli Search. Qualsiasi sia il motore di ricerca che ci troviamo di fronte è sempre importante andare a indagare la sua modalità di !advanced search con i !search commands. Infine ricordarsi sempre che chi ama lo studio deve approfittare della possibilità di frequentare le biblioteche alla ricerca di libri ma anche di ebook.

AD EST DI GOOGLE

Ad Oriente c'è un fiorire di motori di ricerca che riescano a contrastare il predominio di Google e Bing (assoluto nell'area nord-occidentale) come ad esempio il sud-coreano Naver, Baidu e sogou per la Cina, Yandex per la aree russofone.

memorie digitali manipolabili

Memoria digitale

La questione della memoria digitale è una problematica complessa che nasce dall'obsolescenza dei supporti hardware stimabile in moli casi in poco più di dieci anni di durata: i formati software possono viceversa avere vita anche più lunga ma non indeterminata soprattutto se si ragiona di accesso e fruibilità di software proprietario (il !software libero, viceversa, è per sua definizione interoperabile a tempo indeterminato). Per risolvere questa problematica della conservazione del digitale oltre a una serie di competenze diffuse preziosissime per il restauro di hardware obsoleto esistono numerosi standard internazionali come il noto Open Archival Information System nonché iniziative locali per la preservazione degli strumenti di comunicazione. L'informazione digitale deve essere infatti considerata facilmente riproducibile ma non necessariamente conservabile a tempo indefinito: la teoria della conservazione deve prendere in considerazione lo stato di salute dei supporti digitali utilizzati ma anche la capacità informatica di elaborare i medesimi da cui l'importanza di standard informatici aperti e interoperabili e del movimento del !software libero e formati di file esistenti che garantiscano non solo l'accesso da parte dell'utenza ma la piena funzionalità delle interfacce relativamente alla sostenibilità dei formati stessi maggiormente garantita a lungo termine dai file facenti riferimento alla tipologia FOSS per la loro caratteristica di standard aperto: !ExifTool permette di visualizzare e metadati, DROId, come esplicita l'acronimo, consente d'identificare la natura dei file esaminati, !XENA facilita la conversione di file in formati aperti, !ARCHIVEMATICA è una una suite integrata di strumenti open source che consente di archiviare oggetti digitali secondo il modello funzionale !OAIS. Ma quali sono gli ambiti applicativi specifici per l'archiviazione del Web?

Moltissimi strumenti software utili per la conservazione della memoria digitale sul Web ruotano intorno all'apposito standard WARC utilizzato ad esempio da molti !offline browser capaci di scaricare e archiviare interi siti Web come il popolare HTTrack Website Copier che ha un proprio standard di archiviazione ma che può essere convertito nel formato arc tramite il tool httrack2arc sviluppato dall'attivissimo servizio di conservazione digitale portoghese ARQUIVO.PT (standard peraltro adottati anche da altri progetti di archiviazione come quello inglese oppure il Pandora australiano). La questione dei formati di file è peraltro centrale e quindi risultano utili strumenti come ExifTool per il trattamento dei meta dati (fondamentali per descrivere e catalogare la risorsa da archiviare) ma ancor prima tool come "Digital Record Object IDentification" (DROID) utili per l'identificazione del formato dei file ed eventuale loro conversione in formati standard e adatti per la preservazione a lungo termine. cache:www.infoaccessibile.com è una query di esempio che consente di visualizzare la pagina Web nelle sue versioni passate ed archiviate nella cache di motori di ricerca che possano funzionare anche come validazione delle pagine Web (o di altre tipologie di file digitali tramite sistemi crittografici di firma digitale). L'iniziativa più autorevole e utile a livello internazionale per la salvaguardia a lungo termine di file multimediali è il noto e autorevole portale di conservazione digitale Archive che offre la possibilità di accedere e scaricare varie tipologie di opere digitali (dai film ai videogiochi) così come di poter creare delle collezioni private di opere da salvaguardare nel tempo. In Italia deposito legale è finalizzata a salvaguardare nel tempo pubblicazioni digitali quali tesi di dottorato.

Webrecorder offre una serie di tool utili che consentono di archiviare in formati standard siti web mentre si navigano con appositi browser per registrare un'esperienza utente sul Web comprensiva di evenutali sessioni di login (pensate all'esperienza utente social) che peraltro rappresentano delle vere e proprie barriere all'archiviazione per le procedure di offline-browser essendo quest'ultime in grado di salvare solo ciò che è pubblicamente accessibile senza pratiche di autenticazione. Molti social network offrono procedure di backup di pagine e account così come di poter nominare altri account "eredi digitali" mentre i motori di ricerca consentono esportazioni similari come nel caso del servizio !Google Takeout.

La tematica della memoria digitale si trova in molte interfacce digitali a cominciare dalla funzione 'altre date' in Google Maps in modalità Street View: è il caso dei graffiti conservati a futura memoria da graffyard tramite apposizione di QR-Code (anche quando cancellati dai muri come nel caso del percorso Bambina Precoce n. 8 - 1985 di !street art ideato su Wikitude) oppure i libri cartacei che possono tovare nuove forme e nuove opportunità di condivisione (digitali) grazie al movimento !hacker dei DIY book scanner. Particolarmente intrigante la possibilità di acquisire libri in forma di immagine tramite quel fantastico connubio di meccanica-falegnameria-ottica-elettronica che è il !bookscanner da trasformare in fase di post-produzione tramite apposito software ad hoc come ScanTailor in immagini tif e quindi in file pdf tramite altro software specifico come gscan2pdf per renderli infine accessibili tramite i portentosi servizi di !Archive comprensivi anche di opzione ocr per la loro trasformazione in testo vero (e comunque possibile anche con software specifico come OCRFeeder).

Socialaddclose