Le collectif « Greening of Streaming » a lancé une campagne intitulée “LESS” pour “Low Energy Sustainable Streaming” pour étudier jusqu’où la dépense énergétique liée à la compression vidéo peut être réduite pour conserver une qualité acceptable. Le problème est donc vu comme un enjeu de sobriété énergétique, pas de sobriété numérique.
“What if the ‘default’ streaming encoding profile was Energy Optimised with ‘acceptable’ quality for general viewing rather than, as it is today, Quality Optimised (and over provisioned) with no energy consideration?”
- Would it be technically viable?
- Would it really bring energy saving / sustainability benefits?
- Would it be commercially viable?
La question est intéressante. Revoyons les bases.
Dis, comment on fait les encodages ?
L’encodage (ou compression) vidéo utilise des algorithmes qui disposent de nombreux réglages. La consommation énergétique et la qualité du rendu dépendent du temps machine passé à faire des calculs et de la complexité de ces calculs. Si on fait rapidement des calculs simples, on produit de la basse qualité avec peu d’énergie. Inversement, une qualité élevée nécessite une phase d’analyse préliminaire de la vidéo suivie d’une phase de compression optimisée, donc plus de consommation énergétique.
On produit toujours plusieurs qualités (entre 4 et 6 en général) pour que la diffusion s’adapte au débit internet disponible. C’est ce qu’on appelle le streaming adaptatif. La plus haute qualité ne sera jamais meilleure que la vidéo source et les basses qualités sont plus faciles à produire.
En général, les ordinateurs qui encodent sont du même type que ceux qui diffusent les vidéos. La consommation énergétique de l’encodage d’une vidéo est comparable à celle de quelques lectures. Plus une vidéo est lue, plus l’impact de la diffusion l’emporte sur celui de l’encodage.
Par ailleurs, l’encodage peut être matériel ou logiciel. Il fait appel à des algorithmes appelés codecs. Ceux qui produisent le meilleur compromis entre qualité et débit sont les plus exigeants en calculs -donc en énergie- pour le codage par une plateforme comme pour le décodage par le terminal de l’utilisateur.
Un seul codec vidéo est universel, supporté par tous les navigateurs internets sur terminaux fixes ou mobiles. C’est H264 (aussi appelé MPEG-4 AVC ou H264 AVC). Pour encoder en 4K/UHD ou plus, d’autres codecs sont plus performants mais ils ne sont pas universels et la 4K ne présente aucun intérêt pour des écrans fixes ou mobiles dont la résolution est inférieure. Autrement dit, à part pour les services de SVOD (Netflix, Disney+, Prime video…), encoder en H264 est parfaitement suffisant.
Pour réduire le débit d’une vidéo, il est plus simple de brider la qualité diffusée par lecteur que de créer des encodages complexes. Cela permet de réduire le débit de vidéos anciennes sans avoir à les réencoder. C’est donc aussi une solution de rétrocompatibilité ou de réduction d’obsolescence.
Notons aussi que la résolution n’est pas le seul critère de qualité d’une vidéo. La cadence d’image (framerate) compte également. Lors d’une étude qualitative, nous avons démontré qu’une vidéo en 720p à 60 images/s était majoritairement perçue comme “de meilleure qualité” que sa version 1080p à 30 images/s, malgré un débit global inférieur.
Le débit de cette vidéo en 720p à 60 images/s est inférieur de 5% à celui de la même vidéo en HD à 30 images/s mais sa qualité perçue est supérieure :
Comment juger la qualité d’un encodage ?
Une image en full HD comporte 1920 x 1080 = 2 073 600 pixels.
Une seconde de vidéo en full HD en comporte 30 fois plus, soit 62,2 millions.
Le ratio de bits par pixels par seconde (BPPS) (ou « Bits / Pixel x Frame ») est un indicateur du volume de données (bits) utilisé pour encoder une seconde de vidéo. Pour faire (très) simple, plus il est élevé, plus la qualité de l’encodage est élevée.
Avec le codec H264, on considère qu’il est inutile que le ratio dépasse 0,1 car au-delà, les gains en qualité sont imperceptibles. Inversement, il faut éviter de descendre en dessous de 0,05 pour que la compression ne soit pas trop visible.
Autrement dit, le débit d’encodage d’une vidéo full HD en 30 images/s doit être compris entre 6 220 Kbps (62,2 Mpix x 0,1 bits /pix /s) et 3 110 Kbps.
La vidéo d’Avatar ci-dessus a un BPPS de 0,10 correspondant à une résolution de 1280 x 720, une cadence de 60 images/s et un débit vidéo de 5895 Kbps. Au même BPPS, son débit serait de 6220 Kbps en 1920 x 1080 à 30 images/s.
Streamlike permet d’adapter la qualité de l’encodage à la nature de la source. Autrement dit, on appliquera un ratio proche de 0,1 pour des vidéos exigeantes (films, sports…) et proche de 0,05 pour des dessins animés ou des enregistrements de webinaires. La qualité par défaut est intermédiaire.
Faut-il dégrader la qualité d’encodage pour émettre moins de CO2 ?
Un service en ligne d’encodage se revendique “vert” parce qu’il promet de très forts taux de compression, qu’il tente de faire passer pour une réduction d’émissions de GES ! Cela n’a évidemment aucun sens.
Nous avons testé ce service et constaté qu’il effectue des encodages très dégradés et sans discernement, quelle que soit la nature ou la qualité de la source. Au point qu’en répétant des encodages, le ratio BPPS diminue systématiquement pour atteindre des qualités inacceptables.
Si une telle vidéo est envoyée sur YouTube, elle sera immédiatement “remise à niveau” à un débit et un BPPS raisonnables, mais la qualité ne pourra pas être améliorée.
Ce qui permet d’apporter une réponse au questionnement de “Greening of Streaming” : Abaisser une qualité d’encodage est inutile car c’est au niveau de la diffusion que se situent principalement les leviers de réduction d’émissions de GES. Pratiquer un streaming responsable est avant tout une affaire de bon sens.
- Si une vidéo fortement compressée est déposée sur une plateforme sociale, son débit sera relevé pour respecter des standards de qualité. Une compression excessive n’aura servi à rien.
- Si une vidéo est dégradée à l’encodage, la qualité perdue n’est plus récupérable et l’expérience utilisateur est décevante.
- Inversement, si la plateforme de diffusion applique des mesures de sobriété, la pleine qualité de la vidéo reste accessible mais il est possible de décider quand on la rend disponible (par exemple, seulement en plein écran).
- La sobriété a une efficacité immédiate, sans effet rebond. A l’inverse, le bénéfice d’une évolution technologique est différé et permettra surtout de diffuser plus à moindre coût, ce qui aggravera l’impact environnemental.
Pour bien comprendre les débits et les bits / pixel, voici un article ancien mais accessible, en anglais : https://streaminglearningcenter.com/encoding/what_is_data_rate_bits_per_pixel.html
L’encodage est une problématique bien plus complexe que ce que nous avons simplifié ici. Pour des explications plus techniques (et en anglais) vous nous vous recommandons ce site : https://ottverse.com/category/video-compression/
[English] : Is encoding a lever for decarbonization?