Il P4P, un modo mettere d’accordo gli obiettivi e le funzionalità del P2P con le problematiche degli ISP e la protezione dei diritti d’autore

Nel corso del suo sviluppo, Internet si è essenzialmente caratterizzata come un sistema client-server. Per capirne a fondo le problematiche analizziamo uno scenario tipico. Sono in ufficio davanti al computer e ho bisogno di accedere a una informazione. Digito l’indirizzo nel browser e questo si connette ad un server. Il server cerca l’informazione richiesta nel suo archivio e la fornisce indietro al browser, dove io la posso vedere. Consideriamo ora il caso che un collega, seduto nella stessa stanza, voglia accedere alla stessa informazione in modo indipendente, magari dieci minuti dopo di me: seguirà la stessa trafila, ma per una qualche ragione non riesce ad accedervi. Che sia per problemi di connessione, di manutenzione del server, o di cancellazione (volontaria o no) dell’informazione, egli non potrà usufruirne. Peccato, perché di fatto gli basterebbe guardare sul mio schermo, ma lui non lo sa. E questo è un problema: l’informazione esiste, ma il Web non è strutturato per farcela trovare in modo trasparente. Ma c’è un altro problema. Supponiamo che io debba scaricare un informazione molto corposa. Mi connetto al server e mi viene proposta una serie di siti da cui effettuare il trasferimento. Non so quale scegliere, ma alla fine magari basandomi su considerazioni di tipo geografico, ne scelgo uno. Noto che la velocità di trasferimento varia nel tempo: so che dipende dalla congestione della linea, ma so anche che dipende dal carico del server scelto. Ma il meccanismo di trasferimento non mi permette di parallelizzare le richieste di parti del file ai diversi server disponibili e così sono vincolato ad un trasferimento sequenziale. Il P2P nasce per risolvere queste problematiche. Cioè mentre il Web è essenzialmente basato sul modello client-server, il P2P è un sistema di interscambio di informazioni digitali di tipo collaborativo. In altri termini, nel Web c’è un server che eroga l’informazione e un client che ne usufruisce, mentre nel P2P ogni nodo è allo stesso tempo server e client.

Il problema del P2P
L’idea del P2P è allo stesso tempo geniale ed efficiente: l’informazione diventa più accessibile e persistente (la posso ricevere da qualunque nodo della rete che l’abbia ricevuta) e i trasferimenti sono parallelizzati (ricevo porzioni differenti da sorgenti differenti) in modo da renderli non solo più veloci, ma anche più affidabili (la perdita di accesso ad un nodo non pregiudica la possibilità di completare il trasferimento). Tuttavia, come per tutte le invenzioni umane ci sono due modi di usarle. E quindi, anche il P2P può essere utilizzato per condividere informazione “buona” e “non buona”. Infatti al pari di società e privati che lo usano per condividere programmi e dati perfettamente legali, ci sono anche coloro che beneficiano delle capacità di questa tecnologia per diffondere illegalmente materiale protetto da copyright. Il problema coinvolge vari aspetti e attori. Il primo riguarda la violazione dei diritti di copyright per opere specialmente multimediali (canzoni e film) e il dibattito relativo al concetto stesso di copyright. Il secondo invece riguarda gli Internet provider e gli utenti. La Figura 1 mostra come l’uso della rete da parte del P2P è ormai più che prevalente. 

  

 

 Figura 1: Andamento della ripartizione nell’uso delle risorse di rete in funzione del tipo di traffico

 

Inoltre il traffico P2P tende a creare picchi di volumi in modo assolutamente imprevedibile, mentre il tradizionale traffico Web ha dei pattern prevedibili. In altri termini, la minoranza degli utenti sta usando la maggioranza della capacità trasmissiva, saturandola in modo difficilmente prevedibile e gestibile. Il problema della generazione di traffico è collegato non solo alle dimensioni delle informazioni distribuite, ma anche ad una carenza intrinseca del protocollo P2P. Riprendiamo il nostro caso dei due colleghi di ufficio. Se entrambi fossero collegati ad una rete P2P e il secondo richiedesse l’informazione che il primo già ha, ci sarebbe da aspettarsi che il trasferimento sia immediato. Ed invece no: potrebbe anche darsi che tutta l’informazione sia recuperata da altri nodi posti a migliaia di Km di distanza e che nemmeno un byte sia invece preso dal PC posto di fronte. E questo genera traffico ingiustificato nella rete.
 

Una strada diversa: il P4P
La situazione di stallo nella “guerra” tra P2P, ISP e case detentrici dei diritti d’autore non sembra avere vincitori. Di tanto in tanto qualcuno ottiene una vittoria, ma all’orizzonte non si vede la fine della disputa. E forse un vincitore vero non potrebbe neanche esserci. Quello che invece è certo sono costi e impatto negativo che questa situazione causa a tutti. Ma proprio dall’ultima limitazione sono nati spunti per guardare a nuove possibilità. Ad esempio è nato il Progetto Ono, che cerca di permettere ottimizzazione geografica delle connessioni P2P. Ma l’approccio che ha aggregato più sostenitori è quello intorno al P4P. Il P4P (Proactive network Provider Participation for P2P) è un modo per cercare di mettere d’accordo gli obiettivi e le funzionalità del P2P con le problematiche degli ISP e la protezione dei diritti d’autore. Come il nome indica, il tutto viene ottenuto grazie alla collaborazione tra tutte le parti, che ovviamente nel P4P cercano non più di limitarsi a vicenda, ma invece puntano alla collaborazione. Come contropartita a questo sforzo comune offre un incremento di prestazioni stimato intorno al 45%. Il P4P si propone quindi come una evoluzione del P2P che possa sfruttare la connettività Internet in modo più efficiente. In Figura 2 possiamo notare la differenza tra un traffico Internet tipico (CDN), il traffico generato dal P2P e l’approccio P4P.

 

Figura 2: Differenza nell’uso della rete tra i vari tipi di traffico

 

L’analisi applicata del metodo collaborativo, ovvero col contributo degli ISP all’ottimizzazione del traffico P2P, permette di ridurre sensibilmente il numero di hop (salti) richiesti per consegnare l’informazione. Per tornare al nostro esempio iniziale, il P4P permetterebbe di riconoscere la vicinanza tra i due PC nello stesso ufficio, e sfrutterebbe questa possibilità. Ma c’è un vantaggio anche per gli utenti, che si traduce in una generale riduzione dei tempi di trasferimento. In realtà l’algoritmo P4P permette di mantenere costante il tempo di trasferimento indipendentemente dal numero di nodi attivi, mentre nel P2P l’incremento del numero dei nodi porta ad un generale rallentamento (dovuto alla saturazione delle risorse). Di fatto il P4P funziona tramite l’introduzione, da parte degli ISP, di nuove componenti dette “iTracker” che forniscono informazioni sulla configurazione e sull’uso della loro rete. Il nome non è casuale dato che nel P2P il nome Tracker è usato per indicare il server che fornisce informazioni sulla localizzazione dell’informazione cercata. Le informazioni degli iTracker cambiano nel tempo per riflettere l’uso della rete, anche in termini di traffico. Il software P2P, sia lato client che server possono interrogare gli iTracker per identificare il miglior percorso nel momento stesso in cui serve trasferire dei dati. Allo stesso modo il software P2P può, sempre interrogando gli iTracker, decidere di favorire connessioni più efficienti e/o più vicine, invece che sceglierle in modo casuale. Poter caratterizzare geograficamente i nodi è una delle ottimizzazioni primarie del P4P.

Dove siamo con il P4P
La lotta contro il P2P è particolarmente attiva in Europa, Stati Uniti e Cina, per diversi motivi. Ma mentre il mondo politico punta principalmente ad una soluzione legiferativa di tipo coercitivo, affermando che questo è quello che chiedono i fornitori di servizi, In realtà questi puntano invece sul P4P. Ad esempio, a fine agosto 2010 il maggior fornitore si servizi a banda larga Cinese e il più importante produttore di software P2P di quel Paese hanno condotto un test congiunto esteso di uso del P4P. Questo test estensivo si è basato su uno preliminare effettuato nel 2008 e 2009 da alcuni provider Europei e Statunitensi, tra i quali AT&T, Verizon e Telefonica. Il test fatto in Cina è significativo in quanto ha avuto una durata di 4 mesi e ha coinvolto ben sette milioni di utenti che hanno usato il P2P per condividere file multimediali e vedere video in streaming. I risultati sono stati molto promettenti. Si è notata una conversione di oltre il 50% del traffico inter-provinciale a intra-provinciale, riducendo l’uso di banda passante uscente da ciascuna provincia di oltre 40 Gbps. Allo stesso tempo si è notato un incremento medio di circa il 6% nella velocità di scaricamento. Considerando che si trattava di una infrastruttura pilota limitata, le conclusioni sono interessanti. Come corollario va notato che questa implementazione del P4P si è basata su uno standard internazionale: l’ALTO (Application-Layer Traffic Optimization – Ottimizzazione del traffico a livello applicativo), uno standard sviluppato dall’ALTO Working Group, che è parte dell’IETF (Internet Engineering Task Force).

È tutto oro quello che luccica?
Il concetto è sano, la teoria è buona. Ma come accennavamo all’inizio, ogni cosa può essere usata in modi diversi. E anche il P4P non è diverso. In particolare ci sono numerosi nodi aperti a riguardo della privacy. In particolare c’è il (fondato?) dubbio che gli iTracker possano essere usati con funzioni di controllo al fine di prevenire la condivisione di materiale protetto da copyright. Il dubbio è particolarmente fondato poiché, al di là della eventuale volontà degli ISP, la direzione legiferativa di parecchi stati va proprio in quella direzione e potrebbe obbligare gli ISP stessi a trasformarsi in poliziotti della rete. Comunque, pur nella illegalità della pratica di condividere materiale coperto da copyright, che non è in discussione, il problema rimane ed è legato all’attività di monitoraggio in se. Chiunque potrebbe infatti voler distribuire o ricevere materiale legale, ma in perfetto anonimato. Ci possono essere ragioni collegate con la natura del materiale, ma anche semplicemente per evitare di rivelare i propri gusti e poi essere inondati da tonnellate di mail pubblicitarie spazzatura (SPAM). Possibilità tutt’altro che remota. Un secondo aspetto è collegato con le performance. Se infatti è vero che in molti casi di P2P la performance migliora, è altrettanto vero che in altri le performance degradano. Ad esempio, il protocollo di P2P BitTorrent (uno tra i più famosi) è ottimizzato per favorire il trasferimento tra i nodi più veloci e se invece si privilegia l’aspetto di vicinanza, questo vantaggio si potrebbe perdere. Ricordiamo infatti che non necessariamente il nodo più vicino o quello più “economico” sono anche i più veloci. L’ultimo aspetto riguarda la perdita di uguaglianza tra i vari nodi della rete. Questo è un aspetto molto dibattuto, in quanto presenta pro e contro per entrambe le posizioni. Infatti da un lato nodi che usano programmi compatibili con il P4P e magari agganciati a reti performanti conformi al P4P, sarebbero favoriti e discriminati a discapito degli altri. Dall’altro, da questa ottimizzazione beneficerebbero tutti, per lo meno grazie ad un uso più rispettoso e “parco” della rete. Un argomento molto delicato anche in funzione della crescente attenzione al problema del “digital-devide”.

Una strada ancora in salita

La comunità di Internet chiede di risolvere il problema del P2P in modo collaborativo. Il tentativo di chiudere il P2P non è destinato ad avere successo, ma dall’altro canto non è neanche sostenibile che il P2P (ab)usi di una risorsa comune e condivisa quale è la rete. Ci sono varie strade attive e non è necessario che solo una risolva il problema. È invece probabile che si sviluppino diverse soluzioni atte a coprire in modo efficace porzioni del problema. Il P4P è una delle più promettenti in quanto, al di là della soluzione tecnica in sé, si propone di far collaborare i tre principali attori di questa partita, con l’obiettivo di un win-win-win. La strada è ancora in salita, ma vale la pena tenere un occhio su questa tecnologia.