Оптическое распознавание текста (OCR)

Сервис «Оптическое распознавание текста» предназначен для извлечения текста из изображений и сканированных документов. Он поддерживает 8 языков, что позволяет обрабатывать документы с высокой точностью. Это отличный инструмент для цифровизации бумажных архивов и автоматизации ввода данных. Сервис позволяет распознавать текст из PDF-документов, а также из PNG-картинок. Распознанный текст выделяется интерактивной рамочкой на исходной картинке. Нажатие на любой элемент внутри рамки подсветит распознанный текст справа. Если в документе присутствуют таблицы, то они будут также распознаны. Результат работы можно сохранить как HTML.

Этапы работы с сервисом:

  1. Авторизация в системе. Регистрация пользователя. Подтверждение регистрации приходит на указанную почту в течение секунды.
  2. Загрузка файлов. Для этого необходимо на сайте нажать на кнопку «Импорт нового документа».
  3. Обработка документа. Процесс состоит из нескольких этапов. Сначала происходит подготовка документа (препроцессинг), потом следует обработка отдельно каждой страницы.
  4. Результат распознавания. Представлен в виде двух колонок. В левой колонке оригинальная страница, поверх которой нарисованы прямоугольники, обозначающие фрагменты, где алгоритм распознал текст. В правой колонке распознанный текст с распознанными таблицами.
  5. Сохранение документа. Результат распознавания можно сохранить как HTML-документ, воспользовавшись кнопкой «Сохранить как HTML» в правом нижнем углу рабочей зоны. Распознанный документ сохраняется на сервере.

Преимущества сервиса:

  1. Скорость и удобство. С помощью онлайн-сервиса оптического распознавания текста можно быстро и легко сканировать и обрабатывать большие объемы текста. Максимальный размер одного файла: 30Mb
  2. Доступность. Сервис доступен онлайн и не требует установки дополнительного программного обеспечения на компьютер.
  3. Точность. Сервис оптического распознавания текста демонстрирует высокую точность распознавания символов.
  4. Широкий выбор языков. Работает с текстами на 8 языках.
  5. Мультиформатность. Возможность работы с различными форматами, такими как PDF, PNG. Работает с текстами и различными видами документов (паспорт, СНИЛС).
  6. Мобильность. Сервис OCR имеет мобильную версию, что позволяет его легко использовать не только на компьютере, но и планшете или смартфоне.
  7. Объем текста. Количество вводимой информации до 10 тыс. знаков. Для определения объема текста есть счетчик количества символов.