Bitmovin OSCAR: ottimizzare l'utilizzo delle risorse nello streaming video in diretta

bitmovinStreamLo streaming video in diretta è un tipo specifico di streaming in cui un video viene trasmesso in tempo reale. 
La sorgente effettiva del video può essere pre-registrata o registrata simultaneamente. 
Lo streaming live è adatto per luoghi dal vivo, conferenze e giochi. 
Negli ultimi anni le richieste di contenuti dal vivo come notizie, concerti e sport sono aumentate, con un ulteriore aumento della domanda a causa della pandemia COVID-19. Inoltre, nuove applicazioni come e-learning, giochi online, culto, e-commerce e social network come Facebook e Instagram aumentano ulteriormente la domanda di supporto per lo streaming live. 


Sul lato client, è emerso un gran numero di dispositivi e applicazioni con funzionalità diverse come la risoluzione del display, con conseguente aumento della domanda di streaming video con varie caratteristiche come risoluzione più elevata, alta qualità visiva percettiva e frame rate. 
Per soddisfare le esigenze dei clienti, è fondamentale offrire più servizi personalizzati, come diversi livelli di qualità / risoluzioni delle varie rappresentazioni video.

Come migliorare la qualità dei flussi video in diretta.

La prima e ingenua soluzione è trasferire separatamente ogni rappresentazione richiesta. Considerando il fatto che il numero di rappresentazioni è limitato e un numero elevato di utenti può guardare un video in diretta, dovremmo trasferire più volte un livello di qualità dal server di origine ai client corrispondenti. 
Questo approccio può generare traffico ridondante e sprecare una quantità significativa di larghezza di banda di rete limitata, con conseguente degrado della qualità di altri utenti / servizi.

Trasferimento della rappresentazione con alberi multicast

La soluzione alternativa sta impiegando multicast. 
Per utilizzare questa metodologia, un fornitore di servizi deve creare un "albero" multicast dal server di origine che funzioni come "radice" per ciascun livello di qualità desiderato per un client corrispondente. 
Il server di origine invia una singola copia di ciascuna rappresentazione richiesta ai client tramite l'albero multicast. 
I pacchetti video vengono duplicati automaticamente negli elementi di rete, come router, switch e stazioni base della rete cellulare, ogni volta che l'albero multicast è ramificato. 
Nel tipico scenario semplificato un video viene consegnato in qualità diverse a sette client unici collegati tramite diverse stazioni base. 
L'approccio multicasting si traduce in una notevole riduzione dell'utilizzo della larghezza di banda, soprattutto nel nucleo di Internet in cui si trova il server di origine. 
Tuttavia, questo approccio deve ancora affrontare diverse sfide. 
Innanzitutto, ogni router deve mantenere lo stato di un gruppo multicast, che richiede operazioni complicate nei router. 
In secondo luogo, i router multicast IP non hanno una visione globale dello stato della rete e difficilmente possono determinare alberi multicast ottimali per garantire i requisiti di qualità del servizio (QoS) end-to-end. 
Infine, la topologia multicast per lo streaming video è solitamente dinamica, ovvero i client possono unirsi e uscire al volo. 
Tuttavia, le attuali reti IP non sono in grado di riconfigurare i percorsi di instradamento in modo dinamico e adattivo.

Presentazione dell'approccio OSCAR

Per alleviare i problemi attuali del multicasting classico, il Laboratorio Christian Doppler ATHENA presso l'Alpen-Adria-Universität Klagenfurt propone OSCAR (On Optimizing Resource Utilization in Live Video Streaming) come nuovo approccio di streaming video live. 
OSCAR utilizza due tipi di funzioni di rete virtuale (VNF):

Un insieme di server proxy inversi virtuali (VRP) applicati ai margini della rete per aggregare le richieste dei client e inviarle a un controller SDN (Software-Defined Networking).

Un insieme di funzioni di transcodifica virtuale (VTF) per soddisfare i livelli di qualità richiesti dai clienti transcodificandoli dal livello di qualità più elevato.

Dopo aver raccolto le richieste dai VRP, il controller esegue un modello di ottimizzazione per determinare un albero multicast dal server di origine a un sottoinsieme appropriato di VTF. L'utilizzo di VTF consente la riduzione dell'utilizzo della larghezza di banda inviando solo il livello di qualità più alto richiesto (qui QId-4) dal server di origine a VTF su un albero multicast. Poiché i VTF sono responsabili della soddisfazione delle richieste dei VRP, producono i livelli di qualità inferiori dal livello di qualità più alto e quindi li trasmettono ai VRP in modo multicast. L'approccio OSCAR può essere riassunto in tre fasi generali:

Nel primo passaggio, i VRP raccolgono le richieste dei clienti come iscriversi, abbandonare e modificare la qualità, quindi aggiornare di conseguenza il controller SDN.

Il controller SDN esegue un modello di ottimizzazione per determinare un albero multicast dal server di origine ai VRP che passano attraverso i VTF.

I VTF producono i livelli di qualità richiesti dai VRP mediante la transcodifica dal livello di qualità più elevato.

L'ultimo passaggio comprende l'applicazione degli output del controller SDN alla rete (ad esempio, l'impostazione dei datapath), l'esecuzione dei VTF e quindi la trasmissione dei dati dal server di origine ai VRP richiedenti.

Il nuovo approccio OSCAR garantisce che più spettatori possano visualizzare contenuti di qualità superiore con un dispendio di larghezza di banda complessivo inferiore (misurato a livello di server) a velocità significativamente più elevate fornendo solo le rappresentazioni di qualità specificate.

Conclusione

Durante il nostro test dell'approccio OSCAR e dei suoi algoritmi, abbiamo riscontrato che l'utilizzo di VTF ha comportato risparmi sostanziali nell'utilizzo della larghezza di banda della rete grazie alla transcodifica ad altri livelli di qualità richiesti. 
Abbiamo valutato le prestazioni dell'approccio OSCAR confrontando l'utilizzo della larghezza di banda e lo sforzo di selezione del percorso di rete della sequenza video open source Tears of Steel utilizzando una codifica "superveloce" preimpostata con codec AVC. 
Alla fine, il nostro test OSCAR più recente ha mostrato una riduzione del 65% e del 75% nell'utilizzo della larghezza di banda e nel sovraccarico di selezione del percorso rispetto agli approcci all'avanguardia, rispettivamente.

Per visualizzare la ricerca completa, lo studio e l'analisi, scarica il nostro documento sul sito web ufficiale IEEE pubblicato all'interno di IEEE Transactions on Network and Service Management.

Bibliografia: A. Erfanian, F. Tashtarian, A. Zabrovskiy, C. Timmerer e H. Hellwagner, "OSCAR: On Optimizing Resource Utilization in Live Video Streaming", in IEEE Transactions on Network and Service Management, vol. 18, n. 1, pagg. 552-569, marzo 2021, DOI: 10.1109 / TNSM.2021.3051950.

 

Ulteriori informazioni sul laboratorio ATHENA Christian Doppler (CD) qui.

Ringraziamenti: il sostegno finanziario del Ministero federale austriaco per gli affari digitali ed economici, la Fondazione nazionale per la ricerca, la tecnologia e lo sviluppo e la Christian Doppler Research Association è riconosciuto con gratitudine.

Riguardo agli Autori:

Questo progetto è una collaborazione tra l'ATHENA Lab, l'Università Alpen-Adria di Klagenfurt e Bitmovin

Christian Timmerer è professore associato dell'Università Alpen-Adria, Klagenfurt, ricercatore capo presso ATHENA e CIO e responsabile della ricerca presso Bitmovin

Hermann Hellwagner è professore ordinario presso l'Università Alpen-Adria, Klagenfurt e ricercatore capo presso ATHENA

Alireza Erfanian è una ricercatrice e Ph.D. studente del Laboratorio Christian Doppler ATHENA, Alpen-Adria-Universität, Klagenfurt

Farzad Tashtarian è un ricercatore post-dottorato per ATHENA

Anatoliy Zabrovskiy è ricercatrice e docente presso l'Università Alpen-Adria, Klagenfurt

INFO: www.bitmovin.com