----  главная  ----  условия обмена  ----  FAQ  ----
Рипаем субтитры с DVD программой SubRip

Для многих, наверное, это будет великим открытием, но субтитры на DVD хранятся не в виде текста, а в виде картинок. В самом деле, это позволяет значительно упростить бытовые проигрыватели (не надо реализовывать в них программы знакогенерации и хранить изображения символов для всех возможных языков, включая все 40 тысяч китайских иероглифов). Но, в то же время, из-за этого процесс "снятия" субтитров с DVD больше похож на сканирование с распознаванием текста, иными словами, программы-рипперы субтитров выполняют в точности ту же работу, что и ваш FineReader.

Впрочем, не так всё сложно, как кажется на первый взгляд, и сейчас вы самостоятельно научитесь рипать субтитры с DVD. Не забывайте, что многие DVD защищены авторским правом.

Программы, которые вам понадобятся:
- Любой DVD-риппер (DVD Decrypter, SmartRipper и т.д.).
- SubRip (у меня версия 0.96b, хотя подойдёт, наверное, любая достаточно свежая).
Брать здесь: http://subrip.fr.st/ или здесь: http://www.divx-digest.com/.
- WordPad (есть в любой версии Windows).

Рипните DVD на жёсткий диск (DVD Decrypter, SmartRipper и т.п. Если совсем ничего нет, можно попробовать просто скопировать все файлы с DVD-ROM на жёсткий диск). Работая с информацией с жёсткого диска, вы избежите лишних ошибок чтения, или по крайней мере будете информированы об их наличии.

Теперь вам нужно определиться с главным сегментом DVD,- тем, в котором содержится собственно фильм. Обычно после того, как вы рипнули DVD, его видно сразу: он больше всех по размеру и количеству файлов. Например:



Из приведённого примера сразу видно, что основной сегмент DVD находится в файлах с VTS_02_1.VOB по VTS_02_5.VOB.

Запустите SubRip и нажмите кнопку с надписью "VOB" (слева сверху):


Нажмите на кнопку "Open IFO", найдите каталог с рипнутым DVD и выберите из него файл VTS_01_0.IFO (или другой IFO файл, соответствующий основному сегменту).

В правой панельке отобразится список файлов в каталоге.

         - Отметьте файлы, соответствующие главному сегменту.
         - В выпадающем списке "Language Stream" выберите язык (поток субтитров).



Несмотря на то, что в списке указано 32 потока, субтитры обычно содержатся всего лишь в нескольких первых из них (в приведённом примере - всего один поток - русский). Имейте в виду, что часто языки указываются неверно (например, указан французский, а на самом деле испанский или китайский). Особенно это характерно для так называемых "пираток" и китайской видеопродукции.

Итак, вы отметили необходимые файлы, и выбрали поток. Теперь осталось нажать кнопку "Start", после этого начинается собственно процесс, называемый "рип субтитров".

Найдя первый кадр с субтитрами, SubRip предлагает вам выбрать одну из четырёх доступных цветовых схем. Выберите ту, при которой текст виден наиболее отчётливо, белым по чёрному, без обводки. Как правило, хорошо подходит схема, выбранная по умолчанию.

Выбрав схему, нажмите "OK".

Поскольку субтитры выполняются самыми разными шрифтами, распознаватель текста в SubRip реализован как самообучаемый. То есть, встретив очередной незнакомый символ, программа спросит у вас, в какой символ текста его переводить:


Введя символ, нажмите "Enter".
И так далее, пока будут встречаться незнакомые символы.

Несколько советов:

         - Не ошибаться! Неправильно введённый символ потом придётся исправлять по всему тексту (хотя, если вы ошиблись, проще начать всё с самого начала).

         - Имейте в виду, трудно только первые пять минут! Дальше SubRip очень быстро распознаёт практически весь текст, лишь изредка спрашивая незнакомые символы.

         - При распознавании английских субтитров обычно возникает проблема с буквами "L" (строчной) и "i" (прописной), поскольку начертание этих символов в большинстве шрифтов практически идентично. Проблема эта решается только прогоном через спелл-чекер с английским словарём.

         - При распознавании русских субтитров возникает проблема с буквой "ы",- SubRip распознаёт её как две отдельные буквы. Решение заключается в том, что при распознавании первого символа указать букву "ь", а второго - "i", потом последовательность из этих двух символов нужно будет по всему тексту заменить на "ы" (ну, мы к этому ещё вернёмся).

         - Иногда SubRip склеивает несколько символов (2-3-4) в один. При распознавании таких комбинаций просто вводите последовательность символов:


Как только движок в верхней части программы доехал до конца и показал 100%, процесс закончен. Обычно один поток субтитров рипается за 10-15 минут.

После того, как рип закончен, сохраните субтитры, нажав на кнопку с изображением дискетки
(в нижней части экрана):


Теперь можно закрыть SubRip (Он спросит, сохранить ли матрицу символов. Можно не сохранять, она вам вряд ли понадобится в дальнейшем.).

Файл, который мы получили - субтитры в формате SRT. В принципе такой файл уже будет показываться всеми плейерами, но для того, чтобы довести дело до ума, осталась ещё одна завершающая стадия: постпроцессинг.

Нужно произвести в тексте некоторые замены (помните, "ьi" заменить на "ы" и т.п.). Например, это можно сделать программой WordPad,- она есть в любой версии Windows. Загрузите субтитры как текстовый файл и нажмите Ctrl-H:



Введя текст поиска и текст замены, нажмите "Replace All".

Какие замены вы будете производить, зависит от субтиров, я обычно произвожу две: "ьi" на на "ы" и два подряд идущих апострофа - на двойные кавычки.

Сохраните субтитры, они готовы. Для логического завершения работы можно прогнать субтитры через спелл-чекер, или даже прочитать, подправив ошибки, но обычно этого не требуется, на DVD субтитры редко бывают безграмотными.

Статья взята с сайта: http://subtitry.ru

Files