ABBYY FineReader Server (ранее Recognition Server)

Продукт
Разработчики: Abbyy Россия
Дата последнего релиза: 2020/06/01
Технологии: СЭД - Системы потокового распознавания

Содержание

2020

В составе решения «Мониторинг и Защита»

«Катюша Ай Ти», российский производитель МФУ и программ для управления корпоративной печатью, стала сертифицированным партнером ABBYY – разработчика решений в области интеллектуальной обработки информации и анализа бизнес-процессов. Об этом стало известно 17 июня 2020 года. Компания планирует использовать решение ABBYY FineReader Server в составе своего продукта «Мониторинг и Защита», чтобы распознавать тексты в документах, отправленных на печать, и затем определять, нет ли в файлах конфиденциальной информации. Подробнее здесь.

Упорядочивание хранения данных, удаление дубликатов из корпоративных систем

1 июня 2020 года компания ABBYY сообщила о выпуске обновленной версии ABBYY FineReader Server, с помощью которой можно не только оцифровывать большие объемы информации, но и упорядочивать хранение данных, автоматически удалять дубликаты, а также на 16% быстрее обрабатывать чертежи и крупноформатные документы.

Схема работы ABBYY FineReader Server

По данным исследования O’Reilly «Состояние качества данных в 2020 году», большинство компаний испытывают трудности при работе с корпоративной информацией. В числе наиболее распространенных проблем – большое число корпоративных источников и дублирование информации в них (60%) и отсутствие контроля над качеством входящих данных (49%). Устранить эти проблемы помогают технологии интеллектуальной обработки информации, которые позволяют полноценно управлять потоками корпоративных документов, получать только значимые данные и использовать их для развития бизнеса.

«
«В любой компании сотрудники создают, распечатывают, корректируют и пересылают друг другу документы. Это помогает им анализировать изменения, сохранять наработки и принимать решения, что делать дальше: отправить договор на согласование, сохранить документ в архиве или, например, отправить клиенту. Большинство таких файлов нужны лишь временно, а хранить их в организациях дорого и неэффективно. Обновленная версия ABBYY FineReader Server призвана решить эту проблему: решение находит в потоке документов полные копии и определяет, какие из этих файлов надо удалить. Такой подход позволяет экономить вычислительные мощности при миграции данных, а также снижает затраты на обработку и хранение информации»,
»

Возможности ABBYY FineReader Server, отмеченные разработчиком:

  • Автоматическое удаление полных дубликатов – файлов в другом формате и с другим названием, которые по содержанию ничем не отличаются от оригинала. Это позволяет компании избавляться от одинаковых документов, чтобы избегать путаницы и освободить место в файловом хранилище. Подобная функциональность актуальна при создании электронных архивов или миграции данных при вводе новых систем в эксплуатацию.
  • Единый веб-интерфейс для распознавания и конвертации файлов внутри организации. Сотрудники могут быстро распознавать тексты и конвертировать их в нужный формат, без необходимости использовать дополнительные программы.
  • Профили предварительной обработки документов. Решение позволяет создавать автоматические настройки предобработки документов перед конвертацией или распознаванием, которые можно повторно использовать в разных бизнес-процессах. Например, поворот на 90 градусов, изменение цветности, исправление искажений и т.д.
  • Улучшено сжатие цветных изображений. Использование MRC-алгоритмов помогает уменьшать размер файла, сохраняя внешний вид и качество исходного документа, что полезно при передаче больших объемов информации в графических форматах. В представленной версии уровень сжатия показывает до 30% более хороший результат для цветных и серых изображений.
  • Улучшено распознавание штрих-кодов ISBN, PDF417, Aztec и QR, которые применяются в библиотечном деле, пассажирских, железнодорожных и авиаперевозках, маркетинге и ритейле. За счет применения нейросетей качество распознавания повысилось до 15% для разных типов кодов. Скорость распознавания выросла на 20%.
  • Распознавание технической документации, пакетов документов с чертежами и крупноформатных документов стало на 16% быстрее.
  • Поддержка юридически значимой электронной цифровой подписи. PDF-документ, созданный в ABBYY FineReader Server, можно сразу подписать ЭЦП, а затем отправить контрагенту или сохранить копию в электронном архиве, что актуально, в том числе, в условиях удаленной работы.

2019: ABBYY FineReader Server с интеллектуальными OCR-технологиями 16 поколения

13 марта 2019 года компания ABBYY представила FineReader Server – обновленную версию Recognition Server с интеллектуальными OCR-технологиями 16 поколения.

ABBYY FineReader Server

По информации компании, решение дополнило линейку продуктов FineReader. Теперь в нее входят программа для малого и среднего бизнеса ABBYY FineReader, инструментарий разработчика ABBYY FineReader Engine и решение ABBYY FineReader Server для крупных корпоративных заказчиков. Под общим брендом FineReader объединены все продукты компании для распознавания, конвертации и редактирования документов. ABBYY FineReader Server – современное производительное решение со вcтроенной поддержкой 64-битной архитектуры и обновленным интерфейсом для интеллектуальной обработки PDF. Теперь на пользовательских станциях FineReader Server стало еще проще редактировать тексты, индексировать данные, обрабатывать пакеты документов и добавлять в них страницы. Это повышает точность при оцифровке данных, упрощает хранение и поиск информации. FineReader Server переводит документы в форматы PDF, включая PDF/UA, который часто используется при организации электронных архивов.

Обновленные возможности ABBYY FineReader Server:

  • Встроенная поддержка 64-битной системы;
  • Расширенные возможности работы с PDF: ускоренная оцифровка документов с текстовым слоем, возможность улучшения изображений, сохранение закладок из оригиналов документов в PDF, обработка файлов с цифровой подписью, защита PDF водяными знаками;
  • Улучшенная обработка одномерных и двухмерных штрихкодов и возможность распознавания следующих, в том числе Maxicode, распространенного при отправке грузов, и кода 39, который часто используется в розничной торговле;
  • Обновленный интерфейс станций верификации и индексирования. Теперь редактировать тексты и изображения, а также скрывать конфиденциальные данные можно на всех этапах работы с документами. Также появилась возможность задавать шаблоны полей индексирования, что ускоряет обработку документов одного типа;
  • Возможность добавлять пользовательские языки. Актуально при обработке документов с декоративными шрифтами и на древних языках;
  • Дополненные языки распознавания: грузинский, современный японский и фарси. ABBYY FineReader Server распознает больше 190 языков;
  • Доступ к облачным сервисам через консоль администрирования.

2014: ABBYY Recognition Server 4

27 мая 2014 года компания ABBYY сообщила о выпуске ABBYY Recognition Server версии 4 – высокопроизводительного серверного решения для распознавания текста и преобразования документов в электронные редактируемые форматы.

Разработчики сообщили о существенном расширении возможностей работы с архивом документов, интеграции с информационными системами, в новой версии продукта. В системе появились новые сценарии работы с документами, более широкие возможности по работе с PDF-файлами.

  • Улучшены возможности по созданию архивов документов. Перевод изображений в редактируемые форматы расширяет возможности работы с документами для сотрудников, а также позволяет создавать полнотекстовый индекс документов для поисковых сервисов. Новая версия максимально гибко настраивается для работы с электронными архивами документов в зависимости от бизнес-задач пользователей. ABBYY Recognition Server может в автоматическом режиме создавать текстовые версии всех документов – как вновь поступающих в архив, так и уже хранящихся в нем. При переводе архива скан-образов документов в редактируемый вид решение может полностью воссоздать структуру исходного архива, сохраняя или заменяя исходные скан-образы на документы с текстом.

  • Поддержка электронных архивов на основе Microsoft Office SharePoint. Последняя версия продукта не требует отдельной интеграции с электронными архивами на базе Microsoft Office SharePoint: сценарий обработки документов, хранящихся в MS SharePoint, задается непосредственно с помощью настроек ABBYY Recognition Server. Новая версия продукта может в автоматическом режиме добавить текстовый слой ко всем изображениям документов, которые уже хранятся в архиве, что позволит осуществлять их поиск стандартными средствами MS SharePoint.

  • Интеграция с информационными системами стала проще. В ABBYY Recognition Server появилась возможность импортировать группы пользователей из Active Directory и назначать импортированным пользователям права для работы на станциях сканирования.

  • Список возможных значений для индексируемых полей теперь может быть импортирован из внешних файлов или из базы данных, что позволяет использовать одинаковые списки полей для различных рабочих процессов.

Интеграция с различными информационными системами стала проще и может быть реализована при помощи настроечных скриптов и прикладного программного интерфейса (API) Recognition Server.

  • Появились новые сценарии работы с документами. В новую версию ABBYY Recognition Server добавлен специальный режим для обработки технических чертежей. При работе в этом режиме все графические объекты останутся без изменений, а текст на чертежах, который может быть расположен как вертикально, так и горизонтально, будет распознан.

  • Расширены возможности работы с PDF-документами. При импорте PDF-файла ABBYY Recognition Server сохраняет все особенности исходного PDF-документа: закладки, метаданные, приложения (изображения, текстовые документы и т.д.) и добавляет слой с распознанным текстом в новый файл при выгрузке - все характеристики исходного файла и качество изображений остаются неизменными.

  • Создана возможность быстрого просмотра документов в веб-браузере. Для компаний, которые используют интранет-сервис или веб-ориентированные ECM-системы, реализована возможность создания адаптированных версий документов для быстрого просмотра в веб-браузере (файлы минимального размера с качеством, достаточным для комфортного чтения с экрана). Это позволяет сэкономить время на загрузку больших файлов и сократить объем трафика.

  • Повышена отказоустойчивость системы. ABBYY Recognition Server стал более устойчивым к сбоям, а процесс восстановления системы стал еще быстрее, удобнее и проще.

«ABBYY Recognition Server предоставляет расширенный набор сценариев потокового ввода документов и может помочь оптимизировать бизнес-процессы практически в любой современной организации, – отметил Дмитрий Шушкин, директор по корпоративным проектам компании ABBYY Россия. – Решение позволяет бизнесу эффективно обрабатывать массивы документов и оперативно переводить накопленные документы и сканы в полезную и доступную для поиска информацию».

2012: ABBYY Recognition Server 3.5

На август 2012 года ABBYY Recognition Server 3.5 – высокопроизводительное серверное решение для обработки документов и PDF-файлов, полученных со сканера, факса, МФУ. Результатом работы этого решения являются распознанные документы в привычных текстовых форматах: PDF, PDF/A, MS Word и других. Решение имеет широкие возможности интеграции с различными информационными системами; это может быть реализовано при помощи скриптов, XML-запросов, а также посредством API.

Появились новые возможности настройки ABBYY Recognition Server 3.5 на бизнес-процессы пользователя. Так, новая станция сканирования поддерживает индивидуальные пользовательские сценарии, которые могут быть реализованы при помощи скриптов. В частности, можно задать порядок расположения страниц после двустороннего сканирования, выбрать способ разбиения изображений большого формата, указать сразу несколько папок, в которых будут храниться копии отсканированных файлов и пр.TrafficSoft ADC: балансировщик нагрузки с высокой скоростью работы и минимальными аппаратными требованиями

ABBYY Recognition Server успешно используется для решения различных задач потокового ввода данных во многих коммерческих и государственных организациях. Например, при создании электронного архива ABBYY Recognition Server позволит оперативно перевести бумажные документы в электронный вид для последующего добавления их в архив. При правильно настроенных сценариях обработки весь процесс конвертации происходит автоматически. Удобный интерфейс рабочих станций позволяет сканировать документы и регистрировать их в системе с помощью всего лишь нескольких щелчков мышью.

ABBYY Recognition Server автоматически интегрируется с поисковыми серверами Google Search Appliance и Microsoft Office SharePoint Server, давая возможность выполнять полнотекстовый поиск по документам, хранящимся в виде изображений.

2010: ABBYY Recognition Server 3.0

На сентябрь 2010 года ABBYY Recognition Server представляет собой высокопроизводительное серверное решение для автоматизации процессов оптического распознавания изображений и PDF-файлов, полученных по факсу, со сканера или МФУ (многофункционального устройства). Результатом работы ABBYY Recognition Server 3.0 являются документы в привычных текстовых форматах: Microsoft Word, HTML, PDF и других.

Благодаря серверной архитектуре это приложение особенно эффективно для задач, связанных с обработкой больших объёмов документов как в рамках отдельных департаментов, так и в больших корпорациях.

Работа системы: Документы сканируются с помощью станции сканирования или поступают на обработку через «горячую» папку в локальной сети и по электронной почте; Программа автоматически выполняет распознавание изображений и поиск штрих-кодов; При необходимости можно задействовать верификацию и визуально проверить результаты распознавания на станции верификации; Поток распознанных изображений разделяется на документы. Программа позволяет определить тип каждого документа и присвоить ему соответствующие атрибуты; Документы экспортируются в нужном формате (сохраняются в папку, загружаются в СЭД, отправляются по электронной почте и т.д.).

ABBYY Recognition Server состоит из 6 основных компонент:

  • Менеджер сервера управляет всеми компонентами, настройками обработки и очередью заданий;
  • Станция сканирования для работы с документами на этапе сканирования;
  • Станция обработки осуществляет процесс распознавания и конвертации изображений и PDF-файлов;
  • Станция верификации служит для визуальной проверки результатов распознавания;
  • Станция индексирования служит для присвоения документу атрибутов;
  • Консоль удаленного администрирования предоставляет общий интерфейс администрирования для настройки и контроля работы.

Дополнительно можно обеспечить доступ к функциям ABBYY Recognition Server через открытый программный интерфейс (открытый API), что даёт возможности как для реализации клиентской части, так и для интеграции с приложениями других производителей.



ПРОЕКТЫ (9) ИНТЕГРАТОРЫ (5) СМ. ТАКЖЕ (15)
ОТРАСЛИ (4)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (242)
  Directum (Директум) (132)
  Smart Engines (Смарт Энджинс) (123)
  Cognitive Technologies (Когнитивные технологии) (91)
  Синтеллект (Syntellect) (78)
  Другие (746)

  Синтеллект (Syntellect) (52)
  Smart Engines (Смарт Энджинс) (14)
  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Directum (Директум) (5)
  Abbyy Россия (4)
  Другие (32)

  ЭЛАР (Электронный архив, НПО Опыт) (10)
  Beorg (Биорг) (8)
  Smart Engines (Смарт Энджинс) (7)
  NVI Solutions (Норд Вижен Интелледженс Солюшенс) (3)
  Digital Design (Диджитал Дизайн) (2)
  Другие (19)

  Smart Engines (Смарт Энджинс) (21)
  ЭЛАР (Электронный архив, НПО Опыт) (13)
  Синтеллект (Syntellect) (5)
  Beorg (Биорг) (4)
  Digital Design (Диджитал Дизайн) (4)
  Другие (13)

  Smart Engines (Смарт Энджинс) (16)
  ЭЛАР (Электронный архив, НПО Опыт) (9)
  Beorg (Биорг) (2)
  Digital Design (Диджитал Дизайн) (2)
  Content AI (Контент ИИ) (1)
  Другие (6)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР (Электронный архив, НПО Опыт) (11, 243)
  Directum (Директум) (6, 161)
  Smart Engines (Смарт Энджинс) (17, 130)
  Abbyy Россия (16, 111)
  Cognitive Technologies (Когнитивные технологии) (5, 96)
  Другие (171, 622)

  Синтеллект (Syntellect) (2, 52)
  Smart Engines (Смарт Энджинс) (2, 14)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 8)
  Abbyy Россия (2, 7)
  Directum (Директум) (3, 6)
  Другие (16, 19)

  Smart Engines (Смарт Энджинс) (3, 11)
  ЭЛАР (Электронный архив, НПО Опыт) (3, 10)
  Beorg (Биорг) (1, 8)
  Directum (Директум) (3, 4)
  Digital Design (Диджитал Дизайн) (3, 2)
  Другие (10, 11)

  Smart Engines (Смарт Энджинс) (2, 22)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 13)
  Синтеллект (Syntellect) (2, 5)
  Digital Design (Диджитал Дизайн) (2, 4)
  Beorg (Биорг) (1, 4)
  Другие (8, 10)

  Smart Engines (Смарт Энджинс) (3, 16)
  ЭЛАР (Электронный архив, НПО Опыт) (4, 9)
  Digital Design (Диджитал Дизайн) (2, 2)
  Beorg (Биорг) (1, 2)
  Content AI (Контент ИИ) (1, 2)
  Другие (5, 5)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  ЭЛАР ПланСкан - 151
  Synerdocs - 130
  Smart ID Engine (ранее Smart IDReader) - 113
  ABBYY FlexiCapture - 90
  Е1 Евфрат - 87
  Другие 777

  Syntellect Tessa Мобильное согласование - 30
  Syntellect Tessa Графический визуализатор процессов - 28
  Smart ID Engine (ранее Smart IDReader) - 12
  ABBYY FlexiCapture - 6
  ЭЛАР ПланСкан - 6
  Другие 28

  Smart ID Engine (ранее Smart IDReader) - 10
  ЭЛАР ПланСкан - 9
  Beorg Smart Vision - 8
  Directum Jazz - 2
  EasyData: EasySeparate - 2
  Другие 16

  Smart ID Engine (ранее Smart IDReader) - 18
  ЭЛАР ПланСкан - 8
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4
  Syntellect Tessa Графический визуализатор процессов - 4
  Beorg Smart Vision - 4
  Другие 19

  Smart ID Engine (ранее Smart IDReader) - 12
  ЭЛАР ПланСкан - 5
  Smart Code Engine (ранее Smart CardReader, Smart BarcodeReader и Smart MRZReader) - 4
  ContentReader Server - 2
  ЭЛАР СканИмидж - 2
  Другие 11