본문 바로가기

데이터에 가치를 더하다, 서영석입니다.

text1

[논문 리뷰]LRS3-TED: a large-scale dataset for visual speech recognition 이번 논문은 Oxford에서 발표했던 Lib- reading 관련 논문이다. 논문을 선정한 이유는 다음과 같다. 립 리딩을 구사하는데 있어 데이터셋을 구축하기 위함. 같은 저자가 발표한 '“Lip reading sentences in the wild'을 읽는데 있어 필요한 논문이라고 생각함. 립 리딩을 영어가 아닌 한국어로 표현할 수 있다면.. 어떻게 접근해야할지 궁금하다. Abstract 이 논문에서는 시각 및 음성 인식을 위한 새로운 다중 모드 데이터 세트를 소개한다. 여기에는 400시간이 넘는 TED 및 TEDx 비디오의 얼굴 트랙과 해당 자막 및 단어 정렬 경계가 포함된다. 새로운 데이터 세트는 일반 연구에 사용할 수 있는 다른 공개 데이터 세트에 비해 규모가 상당히 크다. 1. Introduct.. 2022. 7. 30.

이전 1 다음

티스토리툴바