Перейти к содержанию
Форум химиков на XuMuK.ru
β

Обработанные книги


ChemProfi

Рекомендуемые сообщения

🚑 Решение задач, контроши, рефераты, курсовые и другое! Онлайн сервис помощи учащимся. Цены в 2-3 раза ниже! 200 руб. на 1-й заказ по коду vsesdal143982

https://yadi.sk/i/iNg6G6IfMsxe0w

11 час назад, St2Ra3nn8ik сказал:

Буду очень признателен, если обработаете справочник под редакцией Савицкого Е. М. "Благородные металлы". изд. "Металлургия" 1984.

Так пойдёт? 


 

  • Like 1
Ссылка на комментарий

Вот ещё что придумал для своей библиотеки:


 

ШИФР КАЧЕСТВ ДОКУМЕНТА ЧЕРЕЗ РЕГИСТР БУКВ В РАСШИРЕНИИ ФАЙЛА.

    *.djvu

d - текст не распознан либо распознан неправильно,
D - наличие OCR на большинстве страниц.

j - текст местами не читается, или истинное разрешение < 300 dpi,
J - текст разборчив.

v - закладки в оглавлении отсутствуют,
V - интерактивное оглавление (BM).

u - страницы разворотами,
U - большинство страниц разделено.

djv - низкое качество, файл получен фотографированием.

    *.pdf

p - файл получен сканированием бумажного документа,
P - файл является результатом вёрстки.

d - текст не распознан, в неправильной кодировке или защищён от копирования -
 - текстовые операции невозможны,
D - правильный OCR слой.

f - интерактивное оглавление отсутствует,
F - навигация по документу возможна по ссылкам в оглавлении.

    *.chm

c - кодировка текста Windows-1251,
C - кодировка текста UTF-8.

H - файл совместим с SumatraPDF v.3.X

m - панель вкладок скрыта,
M - навигация по документу по ссылкам на панели.

  • Like 1
Ссылка на комментарий

Хотел привести в порядок Пороха... Веннена, но оказалось что в моем скане несколько страниц при сканировании наложились друг на друга, и текст стал нечитаемым. Может у кого-то есть приличный скан?

Ссылка на комментарий

Да я ничего особенного и не делал, единственное осмысленное действие с моей стороны - разыскал в djvu-библиотеке оригинал книги Гринберга, перегнал в файлы bmp пару пропущенных вами страниц, потом обработал их в графическом редакторе, чтобы они по внешнему виду и пропорциям были такими же, как страницы в вашем файле. А ваш файл я сначала перегнал в картинки bmp на 300 пикселей программой PDF-XChange, на диске они заняли порядочно места - более 7 Гб. Потом добавил к ним недостающие две, пронумеровав их соответствующим образом, чтобы они встали на своё место по порядку. Потом загрузил всё это дело,  кроме обложки, в Document Express Editor 6.0.1.  и запустил его в чёрно-белом режиме с опцией "почти без потерь". Потом добавил картинку с обложкой в режиме "нормальный", и в итоге получил файл divu на 5,5 Мб, который вы видели выше. При желании можно было сразу задать введение в файл OCR, но если вы читали мои посты выше, то понимаете, что оно мне как-то по барабану. Потом я загрузил этот djvu-файл в STDU Converter, и через полторы минуты он выплюнул 8-мегабайтный pdf. Вот и всё. Я в это время рубился в сети в шахматы с каким-то маньяком. Так что 99% черновой работы было проделано вами.

Изменено пользователем Аль де Баран
Ссылка на комментарий

Ещё я часто пользуюсь сетевым сервером Any2Djvu Server, с ним вообще не надо напрягаться, он автоматически перегоняет файлы pdf в djvu, причём, размер конечного файла обычно получается ещё меньше, чем при только что описанном мной способе. Версия конвертера у него староватая (21-я), но это несущественно, качество файлов вполне себе нормальное. Правда, он обычно отказывается принимать файлы pdf размером более 20-30 Мб, а также с низким качеством, так что ваш 60-мегабайтный файл им не сконвертировать, я проверял. И ещё - если исходный файл pdf относительно небольшой, порядка единиц Мб, то файл djvu может получиться не только меньшего, а даже большего размера, чем исходный pdf :bx:

Ссылка на комментарий
12 минуты назад, Аль де Баран сказал:

Ещё я часто пользуюсь сетевым сервером Any2Djvu Server, с ним вообще не надо напрягаться, он автоматически перегоняет файлы pdf в djvu, причём, размер конечного файла обычно получается ещё меньше, чем при только что описанном мной способе. Версия конвертера у него староватая (21-я), но это несущественно, качество файлов вполне себе нормальное. Правда, он обычно отказывается принимать файлы pdf размером более 20-30 Мб, а также с низким качеством, так что ваш 60-мегабайтный файл им не сконвертировать, я проверял. И ещё - если исходный файл pdf относительно небольшой, порядка единиц Мб, то файл djvu может получиться не только меньшего, а даже большего размера, чем исходный pdf :bx:

Онлайн сервис convertino так сделал с моим 60 мегабайтовым чудом

То есть что бы файл на выходе был меньше нужно обработанные страницы книги пропускать сразу через Djvu Express Editor 6?

Ссылка на комментарий

Размер файла, конечно, зависит от размера страниц, а также от разрешения, чем больше пикселей, тем тяжелее файл.

 

Скрытый текст

Я постом выше не совсем верно назвал программу, правильно будет Document Express Editor, версия 6.0.1. Программа не очень новая, наверняка есть программы и получше, но я как-то привык к этой. Загружать графические файлы (bmp, tiff, jpeg, gif и др.) в неё надо сразу все, так как она прессует картинки в результирующий файл пакетами по 10 штук, при этом получается существенный выигрыш в размере по сравнению с тем, если бы каждая картинка сначала отдельно конвертировалась в формат djvu, а потом они складывались в общий файл, тогда общий размер был бы просто равен сумме djvu-файлов.  Но это только в случае конвертирования файлов в одном и том же режиме, которых там несколько - чёрно-белый, нормальный, электронный, рисунок и т. д. Если же необходимо конвертировать страницы книги в разных режимах, например, страницы с текстом сделать в чёрно-белом режиме (с целью уменьшения общего размера файла), а страницы с цветными иллюстрациями в нормальном или электронном режиме, то придётся разделить картинки на две группы и сначала сконвертировать в нужном режиме одну группу, сохранить файл, а потом добавить к нему в нужные места картинки из второй группы и сохранить в другом режиме. Можно, конечно, и просто тупо сконвертировать в djvu отдельно каждый файл в группах, а потом сбросить их в одну папку, загрузить первый файл в программу, а остальные просто добавить к нему, тогда страницы сами расставятся в нужном порядке, но общий размер получится больше. Но обычно в книгах по химии почти весь объём занимает текст, так что у меня большинство книг сделано в ЧБ режиме плюс обложки и цветные рисунки (если они есть) в нормальном режиме. В программе также есть кое-какие фичи для редактирования файлов djvu, но все эти нюансы можно постепенно изучить и освоить в процессе работы. Рекомендую вам перегнать в отдельную папку картинки из какого-нибудь файла pdf более-менее хорошего качества и поэкспериментировать с ними. Кстати, когда загружаете массив картинок, то сначала загружаете первую, потом из меню "Правка" командой "Добавить страницы после..." вызывается диалоговое окно и в нём мышкой выделяете нужные файлы - выборочно с Ctrl или подряд с Shift. Не забудьте выбрать в меню окна тип ваших файлов, так как по умолчанию в окне будут отображаться только файлы djvu. Файлы для добавления надо выбирать в окне, начиная с последнего, иначе они добавятся в неправильном порядке. Например, сначала открываем программой условный файл 001, потом жмём Правка --> Добавить страницы после ... и получаем окно со списком всех картинок, условно 001-099, левой кнопкой мыши при нажатом шифте выделяем сначала 099, потом 002, тогда весь этот массив файлов выделится и при нажатии в окне кнопки "Сохранить" добавится к 001 в порядке возрастания. Если же выделение файлов начать с 002 в направлении к 099, то файлы добавятся к 001 в порядке 002, 099-003. Если обрабатывается много файлов, то в процессе работы программы может создаться впечатление, что она зависла, так как не реагирует ни на какие действия. Однако, это не так, в чём можно убедиться, запустив диспетчер задач и посмотрев список работающих приложений и загрузку процессора. Через какое-то время программа завершит работу и выдаст результат. Ещё я заметил, что когда обрабатываются файлы формата jpeg (а на этот формат приходится переходить, если на диске не хватает места для огромных файлов форматов bmp или tiff), то одновременно больше 400-450 штук загрузить не удаётся, программа выдаёт ошибку. В этом случае, если в книге много страниц, допустим 900, то их приходится загружать пакетами, скажем, по 300-400 штук, после обработки первого пакета сохранять файл, потом добавлять к нему второй пакет, обрабатывать, сохранять, потом третий и т. д. И напоследок - если производите какие-либо действия по редактированию файлов djvu (а их в этой программе не так уж мало), то не забудьте проверить, снят ли с файла атрибут "Только чтение", иначе все ваши труды по изменению файла пойдут насмарку.

 

Ссылка на комментарий

Для публикации сообщений создайте учётную запись или авторизуйтесь

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйте новый аккаунт в нашем сообществе. Это очень просто!

Регистрация нового пользователя

Войти

Уже есть аккаунт? Войти в систему.

Войти
  • Последние посетители   0 пользователей онлайн

    • Ни одного зарегистрированного пользователя не просматривает данную страницу
×
×
  • Создать...