Hyppää sisältöön
    • Suomeksi
    • In English
Trepo
  • Suomeksi
  • In English
  • Kirjaudu
Näytä viite 
  •   Etusivu
  • Trepo
  • TUNICRIS-julkaisut
  • Näytä viite
  •   Etusivu
  • Trepo
  • TUNICRIS-julkaisut
  • Näytä viite
JavaScript is disabled for your browser. Some features of this site may not work without it.

Task Enhancement Tiles for Ultra Lightweight Post-processing in Visual Coding for Machines

Partanen, Tero; Marie, Alban; Kortelahti, Rudolf; Mercat, Alexandre; Vanne, Jarno; Hannuksela, Miska M.; Zhang, Honglei; Aminlou, Alireza; Cricri, Francesco (2025)

 
Avaa tiedosto
Task_Enhancement_Tiles_for_Ultra_Lightweight_Post-processing_in_Visual_Coding_for_Machines.pdf (1.431Mt)
Lataukset: 



Partanen, Tero
Marie, Alban
Kortelahti, Rudolf
Mercat, Alexandre
Vanne, Jarno
Hannuksela, Miska M.
Zhang, Honglei
Aminlou, Alireza
Cricri, Francesco
2025

This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
doi:10.1109/PCS65673.2025.11417579
Näytä kaikki kuvailutiedot
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202603103097

Kuvaus

Peer reviewed
Tiivistelmä
The proliferation of automated visual analysis calls for compression methods tailored to the unique requirements of Video Coding for Machines (VCM). In this paper, we propose a computationally lightweight post-processing method that is based on a learned component referred to as a task enhancement tile (TET). A TET is spatially tiled over the reconstructed visual data and added to it element-wise. It only requires one addition per pixel in each color channel before the machine task can be applied. Our results with the VVC test model (VTM) demonstrate coding gains of up to 39.0% for object detection and 29.2% for instance segmentation on image datasets, while evaluation on a video dataset shows gains of up to 35.2% for object detection, relative to the VTM anchor. The proposed solution also offers extremely low computational cost, preservation of human-viewable content, full compliance with video coding standards, no requirement for side information transmission from encoder to decoder, and generalization across tasks, models, and encoding parameters.
Kokoelmat
  • TUNICRIS-julkaisut [24742]
Kalevantie 5
PL 617
33014 Tampereen yliopisto
oa[@]tuni.fi | Tietosuoja | Saavutettavuusseloste
 

 

Selaa kokoelmaa

TekijätNimekkeetTiedekunta (2019 -)Tiedekunta (- 2018)Tutkinto-ohjelmat ja opintosuunnatAvainsanatJulkaisuajatKokoelmat

Omat tiedot

Kirjaudu sisäänRekisteröidy
Kalevantie 5
PL 617
33014 Tampereen yliopisto
oa[@]tuni.fi | Tietosuoja | Saavutettavuusseloste