
Оптическое распознавание текста (OCR)
Сервис «Оптическое распознавание текста» предназначен для извлечения текста из изображений и сканированных документов. Он поддерживает 8 языков, что позволяет обрабатывать документы с высокой точностью. Это отличный инструмент для цифровизации бумажных архивов и автоматизации ввода данных. Сервис позволяет распознавать текст из PDF-документов, а также из PNG-картинок. Распознанный текст выделяется интерактивной рамочкой на исходной картинке. Нажатие на любой элемент внутри рамки подсветит распознанный текст справа. Если в документе присутствуют таблицы, то они будут также распознаны. Результат работы можно сохранить как HTML.
Этапы работы с сервисом:
- Авторизация в системе. Регистрация пользователя. Подтверждение регистрации приходит на указанную почту в течение секунды.
- Загрузка файлов. Для этого необходимо на сайте нажать на кнопку «Импорт нового документа».
- Обработка документа. Процесс состоит из нескольких этапов. Сначала происходит подготовка документа (препроцессинг), потом следует обработка отдельно каждой страницы.
- Результат распознавания. Представлен в виде двух колонок. В левой колонке оригинальная страница, поверх которой нарисованы прямоугольники, обозначающие фрагменты, где алгоритм распознал текст. В правой колонке распознанный текст с распознанными таблицами.
- Сохранение документа. Результат распознавания можно сохранить как HTML-документ, воспользовавшись кнопкой «Сохранить как HTML» в правом нижнем углу рабочей зоны. Распознанный документ сохраняется на сервере.
Преимущества сервиса:
- Скорость и удобство. С помощью онлайн-сервиса оптического распознавания текста можно быстро и легко сканировать и обрабатывать большие объемы текста. Максимальный размер одного файла: 30Mb
- Доступность. Сервис доступен онлайн и не требует установки дополнительного программного обеспечения на компьютер.
- Точность. Сервис оптического распознавания текста демонстрирует высокую точность распознавания символов.
- Широкий выбор языков. Работает с текстами на 8 языках.
- Мультиформатность. Возможность работы с различными форматами, такими как PDF, PNG. Работает с текстами и различными видами документов (паспорт, СНИЛС).
- Мобильность. Сервис OCR имеет мобильную версию, что позволяет его легко использовать не только на компьютере, но и планшете или смартфоне.
- Объем текста. Количество вводимой информации до 10 тыс. знаков. Для определения объема текста есть счетчик количества символов.