Показано с 1 по 3 из 3.

WatchOCR - LiveCD для развертывания серверов распознавания отсканированных документов

  1. #1
    Global Moderator Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Аватар для ALEX(XX)
    Регистрация
    31.03.2005
    Адрес
    Чернигов
    Сообщений
    10,777
    Вес репутации
    3704

    WatchOCR - LiveCD для развертывания серверов распознавания отсканированных документов

    Началось бета-тестирование проекта WatchOCR, в рамках которого подготовлен основанный на Knoppix LiveCD-дистрибутив для быстрой организации работы сервера для распознавания и конвертации отсканированных документов. Контроль за прогрессом выполнения операций и настройка параметров дистрибутива осуществляется через web-интерфейс. Размер iso-образа 654 Мб.

    Дистрибутив очень прост в настройке и позволяет с минимальными усилиями (достаточно просто загрузить диск и настроить сетевое соединение) организовать сервер преобразующий PDF с изображениями отсканированных страниц в PDF с данными в тестовом представлении для которых можно выполнять операции поиска внутри документа. После загрузки в web-интерфейсе определяются две директории - одна для входящих и одна для преобразованных документов. Вместо локальных директорий поддерживается монтирование удаленных Windows ресурсов. Пользователю достаточно скопировать PDF или изображение во входящую директорию, после чего дистрибутив проведет распознавание и поместит документ с распознанным текстом во вторую директорию.

    Для распознавания в дистрибутиве используется OCR Cuneiform, для разбора и формирования PDF - ExactImage, для навигации по сетевым SMB-разделам - xsmbrowser. Для совмещения OCR и инструментов работы с PDF и общей организации процесса обработки задействован собственный набор скриптов, который, наряду с кодом web-интерфейса, распространяется в рамках лицензии GPL.

    opennet.ru
    Left home for a few days and look what happens...

  2. Реклама
     

  3. #2
    Full Member Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Аватар для Юльча
    Регистрация
    19.01.2009
    Адрес
    Ukraine
    Сообщений
    350
    Вес репутации
    356
    Цитата Сообщение от ALEX(XX) Посмотреть сообщение
    Пользователю достаточно скопировать PDF или изображение во входящую директорию, после чего дистрибутив проведет распознавание и поместит документ с распознанным текстом во вторую директорию.
    вот тут заковыка, pdf'ку то он переместил, но ничего не распознал, pdf как был картинками так и остался.
    что я делаю не так? ©
    Дуракам закон не писан, если писан, то не читан, если читан, то не понят, если понят, то не так...

  4. #3
    Global Moderator Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Репутация Аватар для ALEX(XX)
    Регистрация
    31.03.2005
    Адрес
    Чернигов
    Сообщений
    10,777
    Вес репутации
    3704
    Цитата Сообщение от Юльча Посмотреть сообщение
    что я делаю не так?
    Откуда ж я знаю... Там же сказано, бета-тестирование. Баг-репорт составлять надо.
    Left home for a few days and look what happens...

Похожие темы

  1. Ответов: 0
    Последнее сообщение: 11.08.2011, 18:10
  2. AVZ - LiveCD
    От razbeg в разделе Софт - общий
    Ответов: 15
    Последнее сообщение: 27.08.2010, 11:24
  3. Ответов: 0
    Последнее сообщение: 22.01.2010, 14:27
  4. Ответов: 0
    Последнее сообщение: 30.01.2008, 01:26
  5. Ответов: 2
    Последнее сообщение: 11.01.2008, 23:40

Свернуть/Развернуть Ваши права в разделе

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
  •  
Page generated in 0.00402 seconds with 19 queries