Несколько лет занимаюсь этими вопросами.
Сначала из DJVU извлекаю картинки в формате .tif, (можно bmp), для полуавтоматической обработки, в т.ч разрезки, использую scantailor.
ABBYY FineReader тоже может разрезать страницы автоматом, а распознаёт кириллицу лучше других программ. Затем картинки собираю обратно в DJVU при помощи
DjVu Small. Это вкратце, надо учитывать пиксельное, цветовое разрешения страниц, поворот, нумерацию и т.д
См. http://www.djvu-scan.ru/forum/index.php