Распознаватель

Оцифровывая те или иные документы, мы, конечно, не сможем спасти деревья, из которых была произведена бумага исходников, но все равно каждой собственноручно сделанной электронной копией мы приближаем день полного отказа от «аналоговых» носителей. В самом деле, уже сейчас только самые последовательные ретрограды еще не приобрели себе ридер и продолжают читать беллетристику в привычном «бумажном» формате. Хотя, казалось бы, давно очевидно, что это и дороже, и вреднее для природы. Да и, наконец, люди, читающие много, очень скоро сталкиваются с проблемой нехватки места на полках под все новые и новые тома. Частные библиотеки уже неактуальны в мире, где тысячи литературных произведений можно спокойно хранить на крошечной флэш-карте.
Не в последнюю очередь за это стоит благодарить тех, кто подарил нам чудо распознавания отсканированных страниц. Ну-ка, специалисты, какая первая ассоциация возникает у вас при виде аббревиатуры OCR? Правильно, и у нас это ABBYY FineReader, который, кстати, обновился уже до 11-й версии.
Для обзора мы выбрали новую версию FineReader 11 Professional Edition, вышедшую в конце этого лета.
По сравнению с FineReader 10 изменений множество. Из самых заметных хочется выделить повышение скорости работы программы. Оптимизация кода ядра FineReader привела к тому, что, по нашим субъективным ощущениям, распознавание стало занимать где-то на треть меньше времени. И если при манипуляциях с одной картинкой это не столь заметно, то в случае какого-нибудь стостраничного «фолианта» выигрыш драгоценных минут вполне может трансформироваться в лишний перекур.
Вторым глобальным изменением стала переработка, я бы даже сказал переосмысление, пользовательского интерфейса. Мастера для разных типов задач теперь стали едва ли не основным способом взаимодействия между FineReader и ее владельцем. Наиболее типичные с точки зрения девелоперов операции можно выбрать из предложенного списка сразу после первого запуска программы. Но давайте не будем нарушать принятую у нас последовательность изложения и начнем с инсталляции.
Установка FineReader 1.1 на компьютер не заняла много времени и интеллектуальных усилий. Единственный нетривиальный выбор, который нас попросили сделать, касался возможности отправки в компанию ABBYY неких анонимных данных, сбор которых будет способствовать дальнейшему улучшению качества программного продукта. В этом же окне, кстати, можно согласиться на установку вспомогательного приложения ABBYY Screenshot Reader. Обратите внимание, что по умолчанию он пропишет себя в автозагрузку. Ну и, наконец, третий чекбокс позволяет дать добро на интеграцию FineReader в контекстное меню «Проводника» и пакет Microsoft Office.
При первом запуске нас встречает уже упоминавшееся выше меню мастеров. Они организованы таким образом, чтобы можно было быстро и не задумываясь выбрать тип источника и формат результата. Источников предлагается три-сканер, файл с заранее оцифрованным изображением и фотография с ЦФК. Оцифрованный текст можно сохранять как документы Word, PDF и HTML. Это основные. На самом деле их гораздо больше, здесь и XLS, и RTF, и ТХТ, и РРТХ, и CSV. Имеются даже ePUB и FB2.
Да-да, теперь электронную книгу можно собрать не покидая главного окна FineReader!
Но для этого ее сначала придется оцифровать с «аналогового» источника. Чего же проще? Выбираем в левой колонке пункт E-book и в открывшемся окне жмем кнопку FB2. Осталось скомандовать «Сканировать в FB2», и вот мы уже видим окно настроек нашей задачи. Параметры вполне можно указать интуитивно, хотелось бы лишь обратить ваше внимание на пункт «Пауза между страницами». Она указывается в секундах, а ее активация позволяет не отвлекаться от переворачивания страниц сканируемой книги. То есть процесс будет идти автоматически, но при этом указанного вами талмута будет хватать для того, чтобы положить на стекло сканера новый разворот. Эта удобная фишка позволяет сохранить уйму времени, особенно если сканер установлен не прямо под рукой, а, скажем, в другом конце комнаты.
Вот почти все и сделано. Дожидаемся окончания процесса, правим, если это необходимо, опечатки, убираем колонтитулы и сохраняем плоды своей деятельности в файл. Признаться, я думал, что сгенерированная в таком полуавтоматическом режиме книга будет собрана кривовато. Каково же было мое удивление, когда оказалось, что не только текст был распознан без ошибок, но еще и все попавшиеся сноски заработали без каких-либо дополнительных телодвижений!
Похожим манером, легко и интуитивно FineReader 11 позволяет справляться со всеми задачами, вовремя «подсовывая под курсор» как раз те пункты меню, о которых пользователь только успел подумать. Надеюсь, руководство компании выдало хорошую премию специалистам, которые занимались проектированием эдакой «интуитивности».
Но что если вместо «гладенького» Джека Лондона подсунуть этой самоуверенной программе что-нибудь более заковыристое? Надо же понять, где пролегают границы возможностей современных OCR-систем. Вот как раз под рукой оказался «Энциклопедический словарь юного физика». То, что надо! Находим разворот с иллюстрацией и формулами, кладем в сканер... И натуральным образом находим эти самые вышеупомянутые границы. Нет, зонирование страницы проведено на отлично - выделены картинки, подписи для них, текстовый блок распознался в лучшем виде, а вот формулы с дробями и квадратными корнями совершенно «рассыпались». Впрочем, честно говоря, мы и не ждали иного исхода - даже у искусственного интеллекта есть свои границы применимости. Придется вставлять формулы графическими блоками.
Для следующего теста мы придумали еще одну повседневную задачу - распознавание фотографии с ЦФК, на которой запечатлен стенд с разного рода полезной информацией. Правда, скажем сразу,
что фото было предварительно немного модифицировано - в графическом редакторе мы отрезали попавшие в кадр рекламные листовки, обрамлявшие объект съемки.
Несмотря на то что бюджетная мыльница сделала все возможное, для того чтобы внести в картинку максимум геометрических искажений, герою нашего обзора все это оказалось нипочем. Все элементы дизайна информационного плаката были выделены в аккуратные блоки, а текст - списки телефонов и названия организаций - наилучшим образом перенесен в Word с сохранением заголовков, 2-колоночной верстки и прочего. Заметим, что уличный «исходник» был немного покарябан вандалами. Поэтому в результате работы FineReader 11 были недочеты, но лишь в тех местах, где и человек при всем желании не смог бы визуально восстановить содранные буквы и цифры. Готовый файлик, кстати, я припрятал - теперь у меня есть координаты всех коммунальных служб моего района!
Журнальное место заканчивается, а еще столько всего интересного можно было бы поведать... Но, прежде чем перейти к выводам, хотелось бы сказать пару слов об упомянутом в начале приложении ABBYY Screenshot Reader. Эта кроха неспроста просилась в автозагрузку. Она спокойно висит себе в трее, не беспокоя пользователя, пока не понадобится. Зато, когда вам, к примеру, необходимо распознать и перевести в цифровой вид какой-то текст на найденной в интернете картинке, достаточно кликнуть по крошечной красной пиктограмме со стрелкой, и откроется миниатюрное меню, в котором следует выделить нужную область или окно, указать язык и направление экспорта. Операция будет выполнена после нажатия единственной большой кнопки. Вроде пустячок, а иногда в других программах такого очень не хватает.
Завершая рассказ, могу, не кривя душой, сказать, что FineReader и раньше на протяжении многих лет был программой первой необходимости. Просто в силу отсутствия достойных альтернатив. Теперь же он, оставаясь таким же нужным, приобрел еще одно важное достоинство: с ним стало по-настоящему приятно работать. Времени на сам процесс уходит заметно меньше, а морщить лоб в поисках нужной настройки не приходится совсем. Прямо хоть в пример другим софтмейкерам ставь!