Dopo aver letto i nuovi post pubblicati da L’indipendente e da Enrico Lanzara , ritorno sull’argomento dell’affidabilità dei contenuti di un blog. Cercheremo di chiarire bene quale possa essere l’utilità di una classificazione di questo tipo cercando al contempo di capire il perché una classificazione seria sia ormai non solo sperata, quanto piuttosto necessaria.

A costo di apparire noioso, vorrei paragonare la blogosfera al concetto più generale di semiosfera come insieme globale della cultura umana proposto da Jurij Lotman. In breve, Lotman ritiene che l’intera cultura umana sia formata da una miriade di linguaggi differenti, capaci però di interagire tra loro tramite dei meccanismi di derivazione biologica. Nella concezione di Lotman non c’è dunque un insieme unico e definito di nozioni e di credenze, quanto piuttosto un grande numero di sottoinsiemi culturali che convivono separati, che si compenetrano, o che entrano in relazione tra loro modificandosi vicendevolmente e formando la cultura che conosciamo e all’interno della quale viviamo. Il mondo di internet è uno di questi, la blogosfera uno dei suoi sottoinsiemi.

All’interno di questa idea di cultura dunque la classificazione e la continua riclassificazione dei dati presenti è condizione necessaria e fondamentale per la gestione e la comprensione dell’insieme, del linguaggio medesimo. Se essa non è efficiente o non avviene, non possiamo sapere lo stato attuale del sistema, quindi per noi è come se esso non esistesse. Ho preso questo esempio di matrice semiotica perché credo sia quello che possa meglio adattarsi al mutevole mondo dei blog e perché rappresenta in pieno lo sviluppo di questo settore della rete secondo una matrice strutturale solida e ben strutturata.

La classificazione dei blog, il poter stabilire la loro influenza, la loro affidabilità, la loro influenza e la loro visibilità (riprendo qui una distinzione fatta qualche giorno fa da Maurizio Goetz nel blog di Giuseppe Granieri), è necessaria il prima possibile perché la blogosfera sta uscendo dal nostro controllo per via di una mole di dati da elaborare evidentemente eccessiva per qualsiasi essere umano. Ritengo inoltre che gli attuali metodi di classificazione (Technorati in primis) non siano affidabili e non forniscano servizi davvero destinati a fare la differenza, ad aiutarci ovvero a gestire in maniera decisamente migliore questa mole di dati. Si potrebbe dunque aspettare il colpo di genio di qualche imprenditore della rete, che venga ad offrirci un servizio migliore, ma credo sia meglio cominciare a discutere e a elaborare qualche idea in proprio, attraverso una discussione collettiva, perché ciò ci garantirebbe maggior libertà e perché ciò ci permetterà un migliore risultato.

La proposta ideale sarebbe quella di avere all’interno della stessa discussione addetti ai lavori (coloro che devono per mestiere stabilire criteri che sono anche di evidente rilevanza economica) e utenti capaci di proporre ed elaborare la proposta più adatta per mitigare l’intervento del fattore economico all’interno di questa classificazione.

I tre punti che riprendo da Maurizio e che vorrei sviluppare sono i seguenti:

  1. Affidabilità di un blog.

Questo è il punto su cui mi sono finora soffermato in misura maggiore (scarica documento in pdf ), poiché ritengo che la classificazione delle fonti in rete sia ancora tremendamente scadente. In quanto studente, ho l’abitudine giornaliera di cercare opere, fonti e idee sulla rete, avendo i problemi di tutti nello stabilirne in breve tempo l’utilità personale di certo, ma in misura maggiore la reale fondatezza di quanto scritto. Ho proposto in questo caso un algoritmo di calcolo che divida su quattro diversi fattori il calcolo (che deve portare ad un semplice risultato numerico) sulla presunta fidatezza di un determinato blog. Ho pensato che i fattori in gioco siano principalmente due, il tempo e il giudizio della rete. Inoltre ho proposto alcuni accorgimenti per cercare di eliminare il rumore di fondo prodotto dalle cricche che si auto-linkano, il rumore prodotto da chi è in rete da molto tempo rispetto magari ai più giovani, ma più valenti, e il rumore prodotto da chi non è affidabile, ma è estremamente abile a produrre rumore e quindi a guadagnarsi citazioni. L’ipotesi è solo al suo primo stadio. Sarebbe interessante, credo, usarla come punto di partenza per produrre un documento valido, inserendo magari altri termini o modificando il peso di quelli presenti. Oltre a questo sarebbe interessante che qualche addetto ai lavori potesse delucidarci, in seguito, su una sua fattibile messa in pratica, ovvero: questa ipotesi oltre ad essere plausibile, regge all’impatto con la prova empirica?

Per fare questo io davvero non ho i mezzi necessari.

Ad essa unirei comunque una classificazione primaria in termini di tags, perché questa permetterebbe di dividere la blogosfera in ambiti meglio definiti, ma non rigidi e permetterebbe al nostro motore di ricerca di terza generazione di stabilire l’affidabilità secondo ambiti meglio distinti, producendo quindi maggiore sensatezza nelle risposte e tempi di ricerca più rapidi. In fondo sapere che il blog di Caio è iperaffidabile per quanto riguarda la cucina ligure, potrebbe non interessarci molto mentre cerchiamo notizie geologiche sul substrato del Gran Sasso…

  1. Influenza di un blog.

L’influenza di un blog è un termine già più complesso, che proporrei tuttavia di calcolare a parte. Questo lo farei perché “influenza” è un concetto ancora più labile di “affidabilità” e deriva per lo più dalle reti di rapporti umani stretti nel tempo dal blogger che dal reale valore dei contenuti che propone. Il punto 4 della mia ipotesi di calcolo dell’affidabilità mira proprio a creare una differenza di valore tra i due termini. Se un blogger ha costruito una solida rete di relazioni, sicuramente sarà in grado di garantire ai propri post un maggiore sviluppo all’interno della blogosfera e quindi avere maggiori possibilità di modificare in qualche modo la situazione. Continuando ad esemplificare potrei dire che questo mio post non avrà l’immediata esplosione mediatica del post di Grillo da ci tutta questa discussione è partita. Questo a prescindere dal reale valore dei contenuti espressi. L’influenza di un blog secondo me è ben definibile dal numero di blogger attivi che seguono e quindi riprenderanno i post pubblicati da esso. Diciamo che se ho 10.000 utenti e uno solo scriverà sul suo blog riprendendo un mio post la mia influenza sarà minore di quella di un blogger che si ritrova solo 100 utenti, ma tutti desiderosi di riprendere la notizia sulle loro pagine. Questo perché ovviamente in rete funzionano leggi esponenziali per diffondere le notizie e un numero maggiore di post, garantisce al 99,9% un numero infinitamente maggiore di contatti.

Per cercare di esprimere numericamente questo valore si potrebbe in maniera molto empirica incrociare il numero di post in cui compare il link ad un determinato blog con la presenza o meno del proprietario del blog che link sul blog di origine (quindi cercare ad esempio un mio commento, e l’ovvio link del mio blog, sul sito di Grillo da cui io riprendo un post). Ma questa è una idea per ora buttata là, e sono le due di notte, quindi mi riservo di modificarla a orari più umani.

  1. Visibilità di un blog.

Questo parametro è forse il più facile da identificare. La visibilità è il numero di contatti virtuali che un blog riesce ad ottenere ad ogni pubblicazione dei suoi post. Per trovare questo valore si potrebbero sommare le visite effettive del blog e le visite effettive dei link diretti che ottengono i singoli post. Parlo di singoli post perché il parametro di visibilità che vorrei calcolare è fatto su ogni post ed è poi messo in relazione con gli altri, sia perché così facendo garantiamo che la maggiore visibilità che hanno coloro che postano spesso sia messa in luce, sia perché ci permetterebbe di valutare in una seconda maniera l’affidabilità del contenuto dei vari post. Se Grillo ottiene mediamente 1 milione di contatti virtuali e quando pubblica un post sulla fisica quantistica ne ottiene solo 400.000, si potrebbe pensare che la rete non lo abbia ritenuto idoneo ad esprimere questo giudizio o che l’opinione esposta non sia stata considerata rilevante.

Questa differenziazione potrebbe permetterci di gestire meglio la situazione, di muoverci con le idee più chiare e di farci fare un passo in più verso un blog semanticamente organizzato in cui cercare le notizie potrebbe divenire più semplice. L’analisi contemporanea dei tre fattori ci porrebbe infatti in condizione di avere sempre un secondo riscontro su quanto andiamo a leggere, permettendoci di decidere in maniera più rapida e con un ridotto margine di errore.

Ma la discussione è appena cominciata, spero!

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.