Берете интересное видео с ютуб. Включаете сервис по распознаванию речи. Такие сервисы автоматом набирают голосовой текст. Также может вбивать текст с видео и аудио. Ищите в интернете. Например https://speechpad.ru/ (не рекл) или https://speechlogger.appspot.com/ru/ (не рекл). Можно скачать видео на комп или указать прямую ссылку. Распознаёт довольно не плохо. (включал обычные новости на телевизоре)
В конце подправляете косяки и подкидывайте фоток
В конце подправляете косяки и подкидывайте фоток