Р СѓР±СЂРёРєРё
 
 

07.02.2005 - FineReader: распознавание средневековых текстов

Вышел FineReader XIX — OCR-система, распознавающая документы, написанные на старых европейских языках, в том числе набранные готическими шрифтами.

Программа ABBYY FineReader XIX совмещает все возможности FineReader Corporate Edition с новой технологией распознавания старых европейских текстов. Программа призвана помогать там, где существует потребность в компьютерной обработке исторических документов и в создании современных архивов: в библиотеках, исторических фондах, в крупнейших университетах и исследовательских центрах по всему миру.

ABBYY FineReader XIX обеспечивает распознавание старых европейских текстов, набранных старинными шрифтами, с учётом особенностей старинных алфавитов, вышедшей из употребления орфографии и морфологии.

Дополнительно к 177 языкам, используемым в системе FineReader, программа поддерживает 5 старых европейских языков: английский, немецкий, французский, испанский и итальянский. В арсенале системы — способность обрабатывать популярные в прошлом шрифты Fraktur и Schwabacher и большое количество готических ("ломаных") шрифтов.

Во время работы над ABBYY FineReader XIX разработчики провели специальное обучение системы: более чем 2500 примеров было подобрано для каждого символа готического шрифта. Созданная технология распознавания была протестирована на 31000 страниц оригинального текста из различных источников. Специальные языковые модели для распознавания старых европейских языков были созданы совместно с партнёром ABBYY — новосибирской компанией ATAPY Software. В ходе разработки проанализировано 10 словарей и более 100 книг, изданных в период с 1750 по 1930 год. В систему добавлено 159 грамматических моделей, не использующихся в современных европейских языках. FineReader XIX учитывает особенности старых европейских алфавитов (с 1600 года) и умеет распознавать вышедшие из употребления символы, например, удлинённое "s" в ранних английских и французских алфавитах.

РЎ РІС‹РїСѓСЃРєРѕРј программы FineReader XIX преобразование исторических материалов РІ электронный РІРёРґ СЃ сохранением возможности полнотекстового РїРѕРёСЃРєР° стало реальностью. Это означает, что исторические документы Рё подлинники РєРЅРёРі, сохраняя СЃРІРѕСЋ художественную ценность, становятся значительно доступнее РІ роли источников информации.

ABBYY FineReader XIX является одним из ключевых компонентов проекта "METAe". Основная цель этого проекта, который объединяет крупнейшие библиотеки Европы и софтверные компании, — создание ПО для архивации и систематизации книг и документов, представляющих историческую ценность.

- Успешность "METAe" доказывает способность решить важную проблему в истории человечества — сохранить ветхие исторические документы и обеспечить их доступность для электронного архивирования и автоматического анализа. Мы всегда готовы участвовать в подобных проектах. Мы надеемся, что и нашим российским партнёрам FineReader XIX придется по душе , - сказал Юрий Корюкин , директор по корпоративным проектам ABBYY Россия.

- Я думаю, созданная компанией ABBYY технология распознавания старых европейских текстов — это важный шаг для развития гуманитарных наук, как на Западе, так и в России. Ведь наши фонды содержат большую коллекцию документов, книг, газет, журналов XVII–XIX вв. Работа с бумажными источниками такого «возраста» и их перепечатка — это очень трудоёмкий процесс. А с появлением возможности сканировать и оперативно распознавать исторические документы мы сможем применить к ним все современные инструменты систематизации, анализа и поиска информации - прокомментировал выход FineReader XIX Михаил Дмитриевич Афанасьев , директор Государственной Публичной �сторической Библиотеки России.


�сточник:

ABBYY


Поиск по сайту
SoftRing     Web

 
 
 
 
 
Карта сайта | Обратная связь

© 2004-2007 Soft Ring: интернет-энциклопедия полезных программ
идея и тексты - Александр Якутский ; дизайн, верстка и поддержка - Александр Цой
Права на републикацию текста книги "Энциклопедия полезных программ" принадлежат издательству "Бестселлер"
Сайт работает РїРѕРґ управлением системы NetCat (© компания РђР�РЎРў )