AviSynth, видео с переменной частотой кадров (vfr) и гибридное видео

По такому параметру как частота кадров видеоматериалы делятся на два типа: с постоянной частотой кадров (CFR = constant frame rate) и с переменной (VFR = variable frame rate). У CFR-видео все кадры имеют одинаковую длительность, у VFR длительность кадров непостоянна. Большинство программ для работы с видео (включая VirtualDub и AviSynth) предполагают, что видео имеет постоянную частоту кадров. Одна из причин - это то, что контейнер AVI не поддерживает VFR-видео. И такое положение дел не изменится в ближайшем будущем по различным причинам. И, хотя контейнер AVI не поддерживает VFR, существуют контейнеры, которые его поддерживают (например: MKV, MP4 и WMV/ASF).

Содержание

Видео с переменной частотой кадров и гибридное видео

Важно понимать, что видео по сути своей является в основном CFR (по крайней мере при видео-захвате и DVD-рипе). Но есть один случай, когда использование VFR весьма полезно - это гибридное видео. Гибридное видео состоит из фрагментов, часть из которых является чересстрочным или прогрессивным NTSC (29.97 кадров в секунду), а остальные - FILM (23.976 кадров в секунду), приведенные к 29.97 с помощью телесина (преобразования телекино). При проигрывании NTSC-фрагменты воспроизводятся с 29.97 кадров/сек, а FILM-фрагменты с 23.976 кадров/сек. (Примечание Tom-а: Я полагаю, вам известно, что FILM-фрагменты также проигрываются с 29.97 кадров/сек, но достигается это дублированием некоторых полей с помощью телесина, переводящего 23.976 в 29.97). Такое гибридное видео можно встретить во многих современных аниме и телевизионных научно-фантастических сериалах, на дополнительных материалах DVD-дисков, где интервью с создателями фильма (29.97) перемешаны с его фрагментами (23.976).

От переводчика: что-то тут автор смутно выражается и примечание Tom-а совершенно справедливо. Было бы уместнее писать не о "воспроизведении", а о том, как такое гибридное видео хранится в MPEG-2 потоке. Ситуация более сложная и в таких NTSC+FILM гибридах могут присутствовать фрагменты не двух, а трех типов:Разумеется, все три варианта проигрываются со скоростью 29.97 в том смысле, что плеер именно с такой скоростью выдает кадры на выходе.

Как распознать VFR-материал (mkv/mp4)

Существует несколько способов определить, что видео в контейнерах mkv/mp4 является VFR:

для mkv: изучить файл с таймкодами кадров, полученный с помощью mkv2vfr.

для mp4: используя mp4dump (брать здесь: MPEG4 tools by MPEG4ip package). В командной строке наберите

mp4dump -verbose=2 holly_xvid.mp4 > log.txt

Полученный лог-файл выглядит так (найдите атом stts, содержащий продолжительности кадров):

type stts
       version = 0 (0x00)
       flags = 0 (0x000000)
       entryCount = 41 (0x00000029)
        sampleCount = 3 (0x00000003)
        sampleDelta = 1000 (0x000003e8)
        sampleCount[1] = 1 (0x00000001)
        sampleDelta[1] = 2000 (0x000007d0)
        sampleCount[2] = 3 (0x00000003)
        sampleDelta[2] = 1000 (0x000003e8)
        sampleCount[3] = 1 (0x00000001)
        sampleDelta[3] = 2000 (0x000007d0)
        sampleCount[4] = 3 (0x00000003)
        sampleDelta[4] = 1000 (0x000003e8)
        sampleCount[5] = 1 (0x00000001)
        sampleDelta[5] = 2000 (0x000007d0)
        etc ...

sampleDelta определяет как долго отображается кадр, а sampleCount - сколько таких кадров. Для приведенного примера получается так:
воспроизводятся 3 кадра с продолжительностью 1000 каждый
потом 1 кадр продолжительностью 2000
потом 3 кадра продолжительностью 1000
потом 1 кадр продолжительностью 2000
и т.д. ...

Значения эти, разумеется, не в секундах, это некие "тики" (или отсчеты), которые можно перевести в секунды, используя значение "timescale", хранящееся в атоме timescale видеодорожки (убедитесь, что вы выбрали нужный timescale, так как у каждой дорожки он свой собственный). В лог-файле это выглядит так:

type mdia
    type mdhd
     version = 0 (0x00)
     flags = 0 (0x000000)
     creationTime = 3197912378 (0xbe9c453a)
     modificationTime = 3197912378 (0xbe9c453a)
     timeScale = 24976 (0x00006190)
     duration = 208000 (0x00032c80)
     language = 21956 (0x55c4)
     reserved = <2 bytes> 00 00 

В этом примере timeScale = 24976. Большинство кадров имеет продолжительность 1000. 1000/24976 = 0.04. Это означает, что каждый из первых трех кадров воспроизводится в течение 0.04 секунды, что эквивалентно 23.976 кадров в секунду (1/23.976 = 0.04). Следующий кадр продолжительностью 2000. 2000/24976 = 0.08 сек, т.е. 12.5 кадров в секунду (1/12.5 = 0.08). и т.д. ...

Приведенные логи взяты из реального гибридного видео-файла.

От переводчика: пример несколько неудачный. Во-первых, сразу видно, что все вычисления изрядно округлены и, например, 1000/24976 вовсе не равно 1/23.976. Было бы интереснее увидеть пример со стандартными частотами кадров 23.976 и 29.97, раз уж о них идет речь в этой статье. Для демонстрации подошли бы такие значения продолжительностей и timeScale:(исходя из того, что 23.976=24000/1001, 29.97=30000/1001, но нужно иметь один общий timeScale)

Загрузка гибридного видео (MPEG-2) в AviSynth и его кодирование

Есть несколько способов закодировать гибридное видео. Первый: сконвертировать все в видео с постоянной частотой кадров (CFR) - либо 23.976, либо 29.97. Второй способ: кодировать с частотой кадров 120, используя контейнер AVI с выпадением части кадров (dropped frames) во время воспроизведения. И последний способ: создать полноценное VFR-видео в контейнере MKV (Матрёшка) или MP4.

Кодировать как 23.976 или 29.97 ?

Если выбрать частоту кадров 29.97, то NTSC-фрагменты будут играться отлично, но FILM-фрагменты будут подергиваться при воспроизведении из-за дублирования части кадров. И аналогично, при выборе FILM (23.976), получим корректное воспроизведение FILM-фрагментов и подергивание NTSC-фрагментов (уже из-за "выброшенных" в результате прореживания кадров). Помимо этого, при выборе 29.97 мы получим худшее качество картинки при том же финальном размере файла, т.к. количество кадров увеличится на 25%.

В общем, сложный выбор. Можно посоветовать такой подход: если бОльшая часть материала идет в FILM-формате (23.976) - выбирайте 23.976, и наоборот, если преимущественно NTSC, то 29.97. Характер исходного материала также имеет значение. Например, если у вас в кадре статичное видео с "говорящими головами", то его можно безболезненно "проредить" с 29.97 до 23.976, не опасаясь визуально заметного подергивания при воспроизведении. Когда вы создаете D2V-проект, вы видите в информационной панели DGIndex, какой материал преобладает - FILM или NTSC. Однако, многие гибридные материалы на самом деле закодированы целиком как NTSC, с FILM-фрагментами, подвергнутыми предварительному телесину (т.е. добавленные поля закодированы так же как и все остальные). В общем, тщательно изучите свой материал, чтобы решить, что же с ним делать.

Плагин Decomb для AviSynth предоставляет два специальных режима прореживания для наилучшей обработки гибридного материала. Чтобы понять, как использовать Decomb, процитируем его документацию:

Преимущественно FILM-материал (mode=3)

Для начала рассмотрим случай, когда исходный материал преимущественно FILM-формата. В этом случае мы хотим проредить FILM-фрагменты обычным образом, сохранив плавность воспроизведения. Для NTSC-фрагментов частоту кадров будем уменьшать "смешивающим" (blending) прореживанием, получая из каждых 5 кадров 4. Полученные последовательности кадров будут воспроизводиться плавнее, чем если бы мы просто прореживали их как FILM-фрагменты.

Типовой скрипт для такой операции:

Telecide(order=0, guide=1)
Decimate(mode=3, threshold=1.0)

Decimate обрабатывает FILM- и не-FILM фрагменты соответствующим образом благодаря двум факторам. Первый: когда мы используем параметр guide=1 в вызове Telecide, мы тем самым разрешаем ему передавать информацию в Decimate о том, какие кадры получены из FILM-фрагментов, а какие нет. Чтобы этот механизм работал, вызов Decimate должен следовать непосредственно после Telecide. Очевидно, что чем лучше (путем подстройки параметров) Telecide сможет распознать шаблоны, с помощью которых поля составлены в кадры, тем лучше справится со своей задачей Decimate.

Второй фактор - это порог срабатывания (threshold). Если в последовательности кадров, анализируемой фильтром, нет дублирующихся, то вся последовательность считается NTSC-фрагментом. Порог определяет процент различия между кадрами, допустимый для того, чтобы считать кадры дублирующимися. Примечание: порог=0 означает, что поиск дубликатов не выполняется совсем.

От переводчика: здесь порог - это вовсе не проценты в общепринятом смысле, а некая своя метрика. Чтобы подобрать для конкретного материала хороший порог срабатывания, удобно на время добавить в вызов Decimate параметр show=true и посмотреть визуально, как работает Decimate при разных порогах.

Не забывайте устанавливать правильный порядок полей для Telecide - для DVD обычно order=1 (верхнее поле первое, TFF), а для захваченного видео обычно order=0. В комплекте с Decomb идет DecombTutorial.html - там описано, как определить порядок полей.

Есть еще один плагин для "обратного телесина" (IVTC, Inverse Telecine), специально предназначенный для обработки гибридного материала, но без смешивания кадров, как у Decomb в режиме mode=3. Это SmartDecimate. Полученные в результате кадры будут "чистые", но при воспроизведении не будет такой плавности, как при использовании Decomb. Типичный скрипт таков:

B = TDeint(mode=1) # или KernelBob(order=1)
SmartDecimate(24, 60, B)

Чтобы по возможности сохранить плавность, перед SmartDecimate выполняется деинтерлейс каким-либо "умным" BOB-алгоритмом.

Преимущественно NTSC-видео материал (mode=1)

Теперь рассмотрим случай, когда материал преимущественно в NTSC-формате. Тут надо избежать прореживания кадров для NTSC-фрагментов, чтобы сохранить плавность воспроизведения. Для FILM-фрагментов же надо сохранить частоту кадров = 29.97, но заменить дублирующиеся кадры на кадры, в которых поля смешаны, чтобы дубликаты были не столь заметны.

Типовой скрипт для такой операции:

Telecide(order=0, guide=1)
Decimate(mode=1, threshold=1.0)

Рекомендации абсолютно те же, что и для режима mode=3 (см. выше)

кодирование как 120 fps, используя AVI с "выброшенными" кадрами

Это наиболее широко совместимый способ. Для этого вам необходимы TIVTC and avi_tc. Начните с создания a прореженного avi и timecodes.txt, но пропустите мультиплексирование. Затем откройте закладку tc2cfr программы tc-gui и добавьте ваши файлы или используйте следующую командную строку:

tc2cfr 120000/1001 c:\video\video.avi c:\video\timecodes.txt c:\video\video-120.avi

Затем муьтиплексируйте с вашим аудио. Это работает так как tc2cfr создает avi с выброшенными (drop) кадрами, заполняя избыточное пространство выброшенными кадрами для создания плавного avi с частотой 120 кадров в секунду.

Есть также старый способ кодирования в 120 fps

Потребуются следующие утилиты

Вся процедура отлично описана здесь. Там же можно скачать и все необходимые утилиты. Но так как процесс можно несколько упростить, мы опишем его тут:

1) Создать индексный файл (idx):

Кладем DVD2AVI 1.76, MPEG2DEC.dll и FPSChk.exe в одну директорию, иначе работать не будет. Запускаем FPSChk.exe. К сожалению, эта утилита на японском языке, но последовательность действий такая: жмем ALT+F, потом O, чтобы открыть файл. Открываем наш D2V-файл. Далее жмем ALT+A, потом S, чтобы просканировать файл и найти в нем FILM- и NTSC-фрагменты. В статусной строке побегут счетчики, так что наберемся терпения и подождем. По окончании сканирования жмем ALT+F и затем W, чтобы сохранить индексный файл.

2) Кодируем как 30 кадров/сек с помощью dec60.dll:

Здесь можно использовать AviSynth v2.5 (но вам потребуется mpeg2dec.dll и dvd2avi 1.76, стало быть потребуется LoadPluginEx.dll, чтобы загрузить плагины от AviSynth версии v2.0x). Создайте следующий скрипт:

LoadPlugin("LoadPluginEx.dll")
LoadPlugin("Dec60.dll")
LoadPlugin("mpeg2dec.dll")

Mpeg2Source("TNGsample.d2v")
Dec60(idxfile="TNGsample.idx", deint=false)

Загрузите скрипт в VirtualDub и закодируйте в DivX/XviD как обычно.

3) Конвертируем полученный AVI с 29.97 кадров/сек в 119.88 кадров/сек:

Запустите AVI60GUI.exe. В нем три поля для ввода. В верхнее вводим имя файла, полученного на предыдущем этапе. Второе поле вводим имя файла, в котором будем сохранять модифицированный AVI-файл. В нижнее поле вводим имя IDX-файла. После заполнения всех трех полей жмем Enter и ждем. По окончании работы получаем плавно воспроизводящийя файл со 120 кадрами в секунду. Теперь самое время смикшировать его со звуковой дорожкой.

Этот метод работает, т.к. хотя на самом деле видео воспроизводится с частотой кадров = 119.88, но для разных фрагментов вставлено разное кол-во "выброшенных" кадров и визуально все выглядит как 23.976 и 29.97 для соответствующих фрагментов. Для 23.976 на каждый реальный кадр вставляется 4 "выброшенных", для 29.97 - 3. При воспроизведении "выброшенные" кадры никак не влияют на картинку, они только "затягивают" время. В цифрах это выглядит так: на 119.88 кадрах в сек один кадр отображается в течение 1/119.88 = 8.34 мс. для фрагмента, который нужно воспроизводить с 23.976 имеем 1+4 кадров, т.е. общее время вывода первого, реального кадра и четырех "выброшенных" = 8.34*5 = 41.7 мс, что и требуется. Аналогично и для 29.97.

Если вы откроете ваш AVI-файл в VirtualDub-е, то увидите, какие кадры являются "выброшенными" (drop). Под изображением кадра будет, например, такая информация: Frame 23 (0:00:00.192) [D] [43.91 kB]. Вот это [D] и означает, что кадр "выброшен". Навигация только по выброшенным кадрам - клавишами { и }. Физически "выброшенные" кадры на самом деле вовсе не выброшены, они есть в AVI-контейнере, есть и в его индексе, но только имеют нулевой размер.

создание VFR-видео в контейнере MKV (matroska/матрёшка)

Возьмите модифицированный плагин Decomb под названием Decomb521VFR, который умеет сохранять файлы с таймкодами и статистикой, по которым можно определить, какие кадры с какой частотой вопросизводятся. Сделайте следующий скрипт:

Mpeg2Source("TNGsample.d2v")
Decomb521VFR_Decimate(mode=4, threshold=1.0, progress=true, timecodes="timecodes.txt", vfrstats="video.vfrstats")
# за подробностями обратитесь к документации Decomb521VFR

(Для создания файла с таймкодами можно также воспользоваться TDecimate из пакета TIVTC от tritical).

Откройте скрипт в VirtualDub-е и запустите на проигрывание. Будут созданы файлы с таймкодами и статистикой. Теперь удалите вызов Decomb521 из скрипта, останется только:

Mpeg2Source("TNGsample.d2v")

этот скрипт закодируйте в DivX/XviD (как 29.97 кадров в сек).

Запустите mmg.exe, который является графической оболочкой для mkvmerge: откройте в нем свои видео и аудио файлы (если необходимо, укажите задержку для звука), файл с таймкодами timecodes.txt и запустите микширование.

Для воспроизведения полученного файла вам потребуется Matroska-сплиттер - на выбор этот (от Gabest) или этот (от Haali).

создание VFR-видео в контейнере MP4

Автоматически это сделать невозможно (используя файл с таймкодами). Выход есть: закодировать множество файлов с фиксированной (но разной) частотой кадров и объеденить их в один MP4 с помощью mp4box с опцией -cat.

подведем итоги по методам

Суммируя все недостатки и достоинства вышеперечисленных методов, можно сказать следующее: создание видео с фиксированной частотой кадров 23.976 или 29.97 удобно, если требуется дальнейшее редактирование в AviSynth, VirtualDub и др., т.к. многие редакторы работают только с CFR-материалом. Но такое видео может воспроизводиться с подергиваниями из-за дублирующихся или выброшенных кадров. Кодирование со 120 кадрами/сек опять же дает нам CFR, но зато отсутствие подергиваний при просмотре. Однако, его создание требует некоторых усилий, да и некоторые из применяемых программ имеют закрытые исходные тексты. Кодирование в MKV с переменной частотой кадров (используя таймкоды) не имеет недостатков (за исключением того, что файлы MKV не воспроизводятся бытовыми плеерами).

Создание VFR-видео в контейнере MP4 с N-VOP-ами

Здесь вы узнаете, как сделать AVI-файл с N-VOP-ами, а здесь - как конвертировать AVI в MP4, используя MP4box или 3ivx mp4 muxer чтобы получить настоящий VFR MP4 поток (N-VOP кадры выбрасываются). Чтобы проверить, что в вашем AVI есть N-VOP-ы, можно использовать GSpot (кстати, видео с N-VOP-ами по-прежнему остается CFR). Однако, данная процедура вовсе не гарантирует, что все дублирующиеся кадры будут закодированы как N-VOP кадры (возможно потому, что необходимое для этого сравнение кадров выполняется после кодирования, а не до ???).

Загрузка гибридного видео (не MPEG-2) в AviSynth и его кодирование

Есть способ открыть VFR-видео AviSynth-ом без потери синхронизации видео и звука (используя DirectShowSource). Если ваше VFR-видео в контейнере MKV, то еще один способ - сконвертировать его утилитой mkv2vfr в AVI с постоянной частотой кадров и файл с таймкодами, потом обработать AVI и перевести обратно в MKV, используя полученные таймкоды.

загрузка не-AVI VFR-материала в AviSynth

Открыть VFR-видео AviSynth-ом и сохранить синхронизацию со звуком возможно. Один из способов - подсчитать среднюю частоту кадров (разделив общее количество кадров на длительность в секундах) и задать полученное значение в вызове DirectShowSource. Вот так:

av_rate = ...
DirectShowSource("vfr.mp4", fps=av_rate, convertfps=true)

В зависимости от продолжительности исходных кадров будет производиться добавление или выкидывание кадров чтобы сохранить синхронизацию.

Перекодирование с частотой кадров 23.976 или 29.97:

DirectShowSource("vfr_startrek.mkv", fps=29.97, convertfps=true) # или fps=23.976

или

DirectShowSource("vfr_startrek.mkv", fps=119.88, convertfps=true)
FDecimate(29.97) # или FDecimate(23.976)

(Я не знаю, что в теории даст лучший результат). Для MP4 это тоже работает.

перекодирование 120 fps VFR-видео

Самай простой способ преобразовать vfr источники обратно в vfr в AviSynth - это использование DeDup:

1-й проход:

DupMC(log="stats.txt")

2-й проход:

DeDup(threshold=.1,maxcopies=4,maxdrops=4,dec=true,log="stats.txt",times="timecodes.txt")

TIVTC также может дедать это:

1-й проход:

TFM(mode=0,pp=0)
TDecimate(mode=4,output="stats.txt")

2-й проход:

TFM(mode=0,pp=0)
TDecimate(mode=6,hybrid=2,input="stats.txt",mkvout="timecodes.txt")

Как только вы закодировали ваш файл, мультиплексируйте обратно в mkv или 120 fps avi.

Это будет убирать все дублированные кадры вставленнные directshowsource, в то же время удерживая количество кадров и времена почти идентичными. Но не используйте файл временных кодов от входного видео, используйте новый. Они могут быть не идентичными. (Конечно вы пожете поиграться с параметрами если хотите использовать большую функциональность dedup.)

Есть также другие более старые способы

Нижеприведенная методика основана на описании, данном HeadlessCow в этой ветке форума.

0) Берем vfrtools, инсталлируем Java VM.

1) Берем фильтр MultiDecimate и создаем AVS-скрипт для файла, который будем кодировать. Убедитесь, что все ненужные кадры обрезаны ДО вызова MultiDecimate в скрипте. В итоге должен получиться скрипт, похожий на этот (никакие фильтры обработки видео здесь пока не нужны):

DirectShowSource("vfr_startrek.mkv", fps=119.88, convertfps=true) # или AviSource для AVI со 120 кадр/сек
ConvertToYUY2() # для MultiDecimate нужен YUY2
MultiDecimate(pass=1)

2) Теперь загружаем скрипт в VirtualDub и запускаем его проигрывание (один раз, при этом никакие перемещения по тайм-лайну делать НЕЛЬЗЯ! Открыли скрипт и сразу запустили), затем закрываем VirtualDub. Теперь у нас есть файл mfile.txt в той же директории, где и AVS-скрипт. Выглядит он так:

0 0.000000
1 0.000000
2 0.000000
3 0.000000
4 0.004137
5 0.000000
...

Каждая строка содержит номер кадра и степень его отличия от предыдущего кадра.

3) Сейчас потребуется vfrtools.jar. Но сначала убедитесь, что у вас установлена Java VM. Из командной строки запускаем vfrtools.jar с двумя аргументами: файлом mfile.txt и исходной частотой кадров, вероятно = 119.88 (поместите vfrtools.jar в ту же директорию, что и ваш AviSynth-скрипт и mfile.txt).

java -jar vfrtools.jar mfile.txt 119.88

В вашей директории будут сгенерированы два файла. Первый - dlist.txt, необходимый для MultiDecimate во время второго прохода:

3 2 1 4550 970
0 0
1 4
2 8
3 12
4 16
5 20
...

В первой строке значения смысла не имеют, за исключением числа кадров. Первые три значения просто выбраны так, чтобы быть "безопасными" (в смысле, что с ними ничего не рушится, не виснет и не глючит).

Второй файл - timecodes.txt в формате, необходимом для mkvmerge:

# timecode format v1
Assume 119.88
0,297,29.97
298,968,23.976
969,969,39.96

Предполагаемая частота кадров выставлена равной исходной, это ничего. Все кадры разделены на интервалы, для каждого из которых установлена своя частота кадров.

4) Измените режим работы MultiDecimate на "второй проход" (pass=2) и закодируйте видео. Ваш AVS-скрипт должен выглядеть примерно так (теперь в конец скрипта можно добавить любые другие фильтры, которые потребуются).

DirectShowSource("vfr_startrek.mkv", fps=119.88, convertfps=true) # or use AviSource for 120 fps avi
ConvertToYUY2()
MultiDecimate(pass=2)

Результат будет иметь несуразную чатсоту кадров, но это не важно, мы это исправим во время соединения видео и звука.

5) Соедините видео и звук с помощью mkvmerge. Только убедитесь, что для видео используется файл timecodes.txt и версия mkvmerge достаточно свежая и поддерживает эту функцию (см. параметр командной строки --timecodes для mkvmerge).

Запустите mmg.exe, являющийся оболочкой mkvmerge: загрузите видео и звуковый файлы (при необходимости установите задержку для звука), загрузите файл timecodes.txt. После этого запускайте микширование.

Для воспроизведения полученного файла потребуется Matroska splitter, который можно скачать здесь (от Gabest-а) или здесь (от Haali).

(Можно вместо MultiDecimate попробовать DeDup. Вроде бы он и для YV12 подходит).

Пребразование vfr в cfr avi для AviSynth

Вы можете избежать анализирования и прореживания с использванием специальных средств, чтобы получить минимальное cfr avi для подачи в avisynth. После обработки и пере-кодировки, примените tc2cfr или mmg к выходу с оригинальными временными кодами чтобы восстановить vfr и полную синхронизацию. (До тех пор, пока вы не удаляете/добавляете кадры, вы можете использовать все тот же файл с таймкодами. Если кол-во кадров изменилось, то прийдется править файл с таймкодами ручками, хотя dedup имеет параметр timesin.)

avi

avi_tc будет создавать временной код и нормальное видео, если avi использует выброшенные кадры и не n-vops или полностью закодированные кадры. Она также требует, чабы не присутствовало аудио или вторая дорожка. Чтобы использовать, откройте tc-gui и добавьте ваш файл, или используйте следующую командную строку:

cfr2tc c:\video\video-120.avi c:\video\video.avi c:\video\timecodes.txt 1

mkv

mkv2vfr извлекает из Матрёшки все кадры в AVI-файл с постоянной частотой кадров и создает дополнительно файл с таймкодами. Это работает только если mkv - в режиме vfw. mkv2vfr работает из командной строки. Вот так:

mkv2vfr.exe input.mkv output.avi timecodes.txt

кодирование VFR-видео в MPEG-2

См. эту ветку форума на Doom9.

Пока нет никаких комментариев по этому поводу.

Синхронизация со звуком

После рассмотрения всех методов кодирования гибридного видео (как 23.976, 29.97 или VFR) возникает вопрос: почему независимо от выбранного метода звук все равно остается синхронизированным с видео? До кодирования видео и звук имеют равную продолжительность и синхронизированы. Во время кодирования возможны два варианта:

Если вы кодируете видео-поток с частотой кадров 23.976 или 29.97 (в обоих случаях - CFR), используя Decimate(mode=3, threshold=1.0) или Decimate(mode=1, threshold=1.0), происходит дублирование/выбрасывание отдельных кадров и, в итоге, синхронизация видео и звука сохраняется.

И, наконец, предположим, что вы открываете свое VFR-видео в AVISynth с помощью DirectShowSource. Сравним:

DirectShowSource("F:\Guides\Hybrid\vfr_startrek.mkv", fps=29.97) # or fps=23.976

и

DirectShowSource("F:\Guides\Hybrid\vfr_startrek.mkv", fps=29.97, convertfps=true) # or fps=23.976

В первом случае синхронизация будет нарушена, т.к. видео ускорено (или замедлено). Во втором - все синхронно, т.к. для конвертации в CFR некоторые кадры будут продублированы или выброшены

Ссылки

Для обязательного прочтения: Force Film, IVTC, and Deinterlacing and more.
Создание видео со 120 кадрами/сек.
Документация к Decomb521VFR.
Про модификацию Decomb521VFR1.0 для автоматизации создания Matroska VFR.
Mkvextract GUI от DarkDudae.

To Do:

Помимо всех тех людей, которые участвовали в создании инструментов, упомянутых в этом руководстве, автор (Wilbert) хотел бы поблагодарить bond, manono, tritical and foxyshadis за ценные замечания и предложения.

$English Date: 2008/07/11 18:23:00 $
Русский перевод 20.07.2005 Рыба-кит
Обновления (не совсем закончены) 01.07.2007 Fizick