2020년 1월 3일(목) - 구글 AI 리서치 블로그
인터넷을 통해 대량의 미디어 컨텐츠를 다운로드하여 스트리밍하는 경우, 품질을 유지하면서 대역폭을 최소화하는 것은 여전히 어려운 과제입니다. 2015년에 연구원들은 신경망 기반 이미지 압축은 이미지 해상도를 크게 향상시키면서 좋은 품질과 높은 압축 속도를 유지할 수 있음을 보여주었습니다. 압축 및 대역폭 최적화 기술의 지속적인 발전은 2018년과 2019년에 CVPR에서 주최한 두 개의 성공적인 워크샵에서 부분적으로 자극되었습니다.
오늘 우리는 CVPR 2020에서 3차 워크샵 및 CLIC(Challenge On Learned Image Compression)에 대해 발표하게 되어 기쁘게 생각합니다. 이 워크샵은 연구원들이 머신 러닝, 신경망 및 기타 컴퓨터 비전 접근 방식을 사용하여 멀티미디어 전송에 필요한 품질을 높이고 대역폭을 낮추도록 요구합니다. 올해 워크샵에는 두 가지 과제, 즉 저속 이미지 압축 문제와 P-프레임 비디오 압축 문제가 포함됩니다.
작년과 마찬가지로, 저속 이미지 압축 문제의 목표는 이미지 데이터셋을 픽셀 당 0.15비트로 압축하는 동시에 가능한 최고의 품질을 유지하는 것입니다. 최종 후보들은 PSNR 및 MS-SSIM 평가 지표에 대한 성과를 측정하여 선정됩니다. 최종 순위는 인간 평가 등급 작업(human evaluated rating task)에 의해 결정됩니다.
올해 우리는 이 시리즈의 첫번째 비디오 압축 작업인 P-Frame 압축 트랙도 소개합니다. 이 과제에서 참가자들은 먼저 두 개의 인접한 비디오 프레임간에 변환을 생성해야합니다. 작업의 압축 해제 부분에서 참가자는 첫번째 프레임과 압축된 표현을 사용하여 두번째 프레임을 재구성합니다. 이 과제는 MS-SSIM 성능 점수만을 기준으로 평가됩니다.
학습된 이미지 압축 또는 비디오 압축 분야에 대한 연구를 수행하는 경우 CVPR 2020의 워크샵에서 발표될 논문 전용 트랙 또는 두 가지 경쟁에 관계없이 CLIC에 참여하는 것이 좋습니다. 현재 제출할 수 있습니다. 테스트셋의 최종 제출 마감일은 2020년 3월 23일입니다. 콘테스트 및 최신 일정에 대한 자세한 내용은 compression.cc를 참조하십시오. 추가 공지 및 질문에 대한 답변은 Google Groups 페이지에서 확인할 수 있습니다.
감사의 말
이 워크샵은 Google, Twitter 및 ETH Zurich의 연구원들이 공동으로 주최합니다. George Toderici (Google), Nick Johnston (Google), Johannes Ballé (Google), Eirikur Agustsson (Google), Lucas Theis (Google), Wenzhe Shi (Twitter), Radu Timofte (ETH Zurich) 및 Fabian Mentzer (ETH Zurich)의 기여에 대해 감사함을 전하고 싶습니다.
게시자: Google Research 소프트웨어 엔지니어, Nick Johnston
원본 제목: 학습된 이미지 압축에 대한 세번째 워크샵 및 과제 발표
원본 링크: https://ai.googleblog.com/2020/01/announcing-third-workshop-and-challenge.html
이 블로그는 2020년 1월 30일(목), Google AI Research Blog 기사를 영어에서 우리나라 말로 번역한 것입니다. 또한 이 번역 글은 정보 공유 목적으로만 작성했으므로 어떠한 상업용으로 사용할 수 없으며, 원본 저작물 모두 구글에게 저작권이 있음을 알려 드립니다. (First Draft Version)