Информатика -взгляд 2


 Преобразование документов в электронную форму - часть 5


Если структура страницы очень сложная, удобнее использовать ручную сегментацию или ручное редактирование результатов автоматической сегментации. Блоки отображаются в виде цветных прямоугольников с номером в левом верхнем углу. Новый блок создают протягиванием мыши по диагонали прямоугольника. Текущий блок помечается выделенной линией, а его углы — прямоугольными маркерами. С помощью этих маркеров можно изменить размер или положение блока.

Команды редактирования блоков выведены на панель Инструменты. Они позволяют:

•    объединить два блока в один (Добавить часть блока);

•    удалить фрагмент блока (Удалить часть блока);

•    изменить положение блоков (Переместить блоки);

•    изменить порядок нумерации блоков (Перенумеровать блоки);

•    изменить разбиение таблицы на ячейки (Добавить вертикаль, Добавить горизонталь, Удалить линии);

Разные типы блоков обрабатываются программой по-разному. Чтобы изменить тип блока, надо щелкнуть правой кнопкой мыши в его пределах и назначить новый тип с помощью меню Тип блока в контекстном меню. Программа FineReader поддерживает следующие типы блоков:

•    текстовый (Текст) — на этапе распознавания преобразуется в текст;

•    табличный (Таблица) — представляет собой набор ячеек, каждая из которых преобразуется в текст по отдельности;

•    изображение (Картинка) — включается в документ без изменений как графическая иллюстрация, если формат сохранения преобразованного документа допускает вставные объекты;

•    лишний (Нераспознаваемый) — игнорируется;

•    содержащий штрих-код (Штрих-код) — распознается как штрих-код.

Распознавание текста. Процесс распознавания текста после сегментации начинается с щелчка на кнопке Распознать и полностью автоматизирован. В ходе процесса отображается диалоговое окно Распознавание, позволяющее прервать процесс. Кроме того, в этом окне отображаются сообщения, указывающие на наличие проблем при распознавании.


Начало  Назад  Вперед