Погода: −2 °C
16.11−3...−1пасмурно, небольшой снег
17.11−6...−3пасмурно, без осадков
НГС.Форум /Компьютеры Интернет Связь / Программное обеспечение /

Чем слкеивать 2 текста для распознавания в OCR?

  • Какое ПО порекомендуете для склеивания двух текстовых изображений для дальнейшего распознавания в OCR?
    Заранее благодарен за дельные советы.

  • а нафига?... сначала распознали по частям... потом склеили в любом текстовом редакторе.. или текст у вас вдоль разрезан?

  • Текст газетный, формата А3. Идёт в несколько колонок. Склеить колонки в нужном порядке в текстовом редакторе не удастся. Поэтому нужно склеивать на стадии сканирования картинки.
    Давным-давно у ручных сканеров была такая функция. У guineform, давно, тоже, кажется, было.
    В файнридере такого нет. Сканер формата А3 стоит слишком дорого.
    Поэтому повторю вопрос... Чем склеивать 2 отсканированных картинки (А4) с многоколоночным текстом в формат А3 для последующего распознавания в OCR?

  • ??????? :а\?:
    какая то проблема замороченная! Ну фотошоп тебе нужен! А на стадии сканирования тебе ни одна программа не поможет - все идет через Твайн. А вообще при сопостовлении времени потраченного на склеивание и цене за А3 - скан а3 бкдет выгоднее!

  • фотошоп спасёт мир...
    на стадии сканирования планшетным сканером это действительно навряд-ли возможно....

  • Как я понимаю, нужен софт типа того, которым склеивают аэрофотоснимки. Не в фотошопе же их друг к другу подгоняют!

  • А почему бы и нет... Чем фотошоп плох для этой цели? Как бы изначально создан для работы с фотографиями...

    Кто яростно ненавидит мотоциклистов тот сам латентный мотоциклист.

  • > Чем фотошоп плох для этой цели?

    Просто для аэрофотосъемки надо склеивать сотни фотографий, совмещая граничные изображения. Не думаю, что фотошоп предназначен для такого. Хотя очень может быть что есть для него специальный плагин.

  • В ответ на: Чем фотошоп плох для этой цели? Как бы изначально создан для работы с фотографиями...
    Фотошоп не просто плох, он АБСОЛЮТНО непригоден для этой цели. И создан он для работы не с фотографиями, а с изображениями. То есть с набором пикселей, а не изображениями реальных объектов, имеющих свои характеристики.

    А программы для обработки снимков действительно есть... и их много...
    Например Erdas Imagine, TNT, ER Mapper, Intergraph...
    Ну или полегче типа Idrisi, Ilwis, Photomod...

    Автор благодарит алфавит за любезно предоставленные буквы...

  • О, точно... На Erdas Imagine и пусть клеит... очень, блин, подходящая программа, чтобы слепить в одно два растровых изображения... Это можно вообще пайнтом сделать, а еще FineReader, начиная с седбмой версии вполне корректно обрабатывает верстку в несколько колонок...

    Кто яростно ненавидит мотоциклистов тот сам латентный мотоциклист.

  • Сам понимаю, что ОДИН раз можно склеить хоть в паер поинте.. но человеку то надо много раз... одно и тоже...

    Тут даже одной программы мало... надо целую технологию... А так вот на лету ничего и не припоминается...

    Поэтому путного мы ничего не подсказали, но участие в решении его проблемы приняли.. :ухмылка:

    Автор благодарит алфавит за любезно предоставленные буквы...

  • Чето я туплю! А фотографии м электронном виде - не набор пиксилей? А для склейки аэрофото используется софт уж больно специалезированный! И человеку ему только из-за склеивания изучать...запарится.

  • В ответ на: А фотографии м электронном виде - не набор пиксилей?
    Для фотошопа и есть набор пикселей, а для тех программ не набор, вернее НЕ ТОЛЬКО набор. То есть если в фотошопе одна фотография ничего не знает о другой и независимая, то в тех прогах они влияют друг на друга. Это либо общая система координат, либо явное указание, либо другие методы.
    Например, известно, что оси 2-х фото лежат параллельно, и пиксель №3456, строки №4200 фото №1 соответсвует пикселю №1 строки 1516 фото №2.
    Тогда процедура склеивания 2 фото будет выглядеть так: удалить все пиксели в фото №1 после 4200 строки и 3456 столбца и дальше добавить изображение №2, начиная с 1517 строки и 2 столбца...

    Объяснил конечно грубо, и реально это выглядет не так (там всё обычно делается в координатах), но всё-же...

    А в фотошопе это можно делать только вручную... что для фотографий числом более 2 задача почти нерешаемая...

    В принципе я видел несколько простых прог для тупой склейки нескольких растровых фрагментов в одну простыню, написанных "для себя", но где их достать или скачать незнаю...

    Автор благодарит алфавит за любезно предоставленные буквы...

  • Теперь я за кампанию:)

    Сканируется по частям скажем формат А4. В графическом редакторе создаем пустой лист требуемого формата от А3 до А0.

    Далее процедуры копи-энд-пэйст. Из маленьких форматов в большой. Совмещение визуальное. Делается быстро, ну если комп тянет. Сам так делал.

  • > Совмещение визуальное

    Так вот этого как раз не хотелось бы.

  • Благодарю всех за советы.
    Небольшой отчёт.

    Да, возможно, с учётом затраченного времени, сканер формата А3 (29 тыс. руб) окажется выгодней А4 (2,7 тыс.руб). К сожалению, пока, это вне бюджета (ну, как всегда, собсно, под новый год, и после нового года в особенности:улыб:).

    Затраты по времени сканирования-склеивания-распознования оказались даже не сравнимы со временем сохранения файла из фотошопа и его загрузку потом в файнридер (ноут pentium M 1400, 256 RAM):
    в формат TIFF - ~5 мин., размер файла 68мег
    в формат PDF - ~3 мин., размер файла 18 мег.
    Загрузка в файнридер - всего лишь в два раза быстрее сохранения.
    Сам сканер (perfection 1270) на 600dpi прогон делает несравнимо быстрей, секунд за 30.

    Т.е. время сохранения/загрузки оказалось самым критичным для работы. Подозреваю, что докупка памяти в ноут не даст значительного прироста (покупка отдельного компьютера с большим объёмом памяти и процем помощней без сканера А3 - имхо, пустая трата денег)

    Дальнейший выход - чесать репу на предмет более шустрых чем фотошоп программ и аккумулировать денежку на А3.

    Кто может посоветовать программы пошустрей фотошопа? (работа, напомню, ведётся с ч/б изображением, само изображение только склеивается в программе, без дополнительной обработки - т.е. ресурсы фотошопа расходуются впустую)

  • В ответ на: Далее процедуры копи-энд-пэйст. Из маленьких форматов в большой. Совмещение визуальное. Делается быстро, ну если комп тянет. Сам так делал.
    Делается и на моем компе быстро, сохраняется из фотошопа - долго.
    Одну страницу можно терпеть - а 10-15 уже критично.
    Какой программой пользовались, на каком компе и сколько времени занимало? (изображение - 600 dpi, черно-белое)

  • а зачем вам файлы на 600? файнридер их все равно на 300 пересчитывает перед распознаванием... а вы теряете время на сканировании и раздуваете объем файла в 4 раза...

    ради интереса можете попробовать Ulead PhotoImpact... может он будет побыстрее...

  • Да какая разница, какая прога!!!??? Операция сохранения зависит от скорости железа..т.е. жесткого. И ни надо ломать голову - визуальное совмещение кусочков или по координатам, все равно при сканирование не возможно идеально расположить лист...и всеравно придется его подравнивать (наклон и т.д.) в фотошопе или в Gis системе. Вообщем вывод такой - своими силами Вы ни чего несделаете, покрайней мере как хотите. Берете свои "портянки" и топаете в фирму где есть сканер А2-А3 формата, оплачиваете работу и все ОК!

Записей на странице:

Перейти в форум

Модераторы: