Appendice B. Scalabilità

Questa appendice è dedicata ad un'analisi matematica, seppure approssimativa, della scalabilità di un modello di gestione della posta come quello descritto in questo documento. Tale modello viene utilizzato per una rete geograficamente distribuita di servizi che non supportano la redirezione del client (nel nostro caso SMTP e POP/IMAP).

In questo modello, i messaggi arrivano con eguale probabilità su ciascuno dei server disponibili, e vengono ritrasmessi al server di destinazione finale attraverso un canale interno (VPN).

L'ipotesi di distribuzione geografica (non-locale) è che questo canale privato utilizzi le stesse risorse di banda dei messaggi in arrivo. E' anche ragionevole supporre che questo canale abbia una qualche possibilità di comprimere il traffico che vi transita, e denoteremo con c il suo fattore di compressione.

Supponiamo allora di avere un traffico di messaggi in ingresso pari a i (in qualche unità di banda), e sia N il numero dei server: se la probabilità che il messaggio debba essere ritrasmesso è

allora per ciascun server il traffico in ingresso sarà

e genererà un corrispondente traffico in uscita (tenendo conto della compressione)

sul canale privato.

Ciascun server riceverà un traffico os dagli altri N - 1 server, dunque il totale del traffico in ingresso (contando anche il traffico che entra attraverso il canale privato) sarà:

Per N che tende all'infinito il valore di itot tende a

Il significato di questa equazione è che un modello di traffico di questo tipo (cioè con reinstradamento interno) è linearmente scalabile con il numero N di server installati: infatti capovolgendo l'ultima equazione si ha che, fissata la disponibilità di banda di ciascun server, la capacità totale del sistema (in termini di traffico) risulta direttamente proporzionale ad N. Dato poi che si parla, per il caso in questione, di traffico SMTP, il coefficiente di compressione c può assumere valori piuttosto bassi (elevata comprimibilità), minimizzando l'overhead della ritrasmissione.

Un'altro modo di vedere quest'ultimo risultato è che, considerato che la banda a disposizione di ciascun server è generalmente fissata (dalle disponibilità tecniche e dai costi), questa si suddivide, per ciascuna macchina, nel caso limite di N che diventa molto grande, a metà tra traffico "interno" e traffico proveniente dall'esterno.