Разложить PDF на составляющие или отпарсить PDF
Добавлено: 08.09.2017 10:39:11
Всем доброго дня и хорошего настроения!
Есть PDF файл, в нём куча картинок и описания к ним. Тексты, хранятся в виде текстов их можно копировать и вставлять в блокнот.
Собственно, вопрос:
чем можно конвертировать PDF в нормальный формат типа TXT или XML или HTML, чтобы при конвертации можно было как-то сохранить структуру ?
В общем по сути, нужно отпарсить PDF и получить названия, тексты и т.д.
Есть такие модули?
спасибо.
Есть PDF файл, в нём куча картинок и описания к ним. Тексты, хранятся в виде текстов их можно копировать и вставлять в блокнот.
Собственно, вопрос:
чем можно конвертировать PDF в нормальный формат типа TXT или XML или HTML, чтобы при конвертации можно было как-то сохранить структуру ?
В общем по сути, нужно отпарсить PDF и получить названия, тексты и т.д.
Есть такие модули?
спасибо.