Можно ли загрузить для распознавания файлы в формате HTML и xml?
В сервисе распознавания документов поддерживаются следующие форматы файлов:
1. Изображения в форматах JPEG, PNG, BMP;
2. Одностраничные изображения в формате TIFF;
3. Документы в формате PDF, включая многостраничные;
4. Файлы в форматах MS Word и MS Excel;
5. Архивы в формате ZIP, содержащие вышеназванные файлы.
При попытке загрузить файлы в форматах HTML и xml сервис выдаст ошибку.
Причем если ошибка загрузки файла в формате xml неустранима, то проблему с загрузкой HTML можно решить. Для этого разверните документ в браузере и сделайте скрин (можно даже без обрезки полей), сохранив его в любом используемом формате.
При загрузке скрина ошибок не возникло, после сопоставления можно создать учетный документ.