Class AsposeOcr

Class AsposeOcr

Namespace: Aspose.OCR
Assembly: Aspose.OCR.dll (25.1.0)

Основной API для библиотеки Aspose OCR

public class AsposeOcr

Наследование

objectAsposeOcr

Унаследованные Члены

object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Конструкторы

AsposeOcr()

public AsposeOcr()

Методы

CalculateSkew(OcrInput)

Вычисляет углы наклона изображений. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.

public List<skewoutput> CalculateSkew(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

List<SkewOutput&gt;

Список углов наклона в градусах Aspose.OCR.SkewOutput.

CompareImageTexts(string, string, RecognitionSettings, bool)

Проверяет, содержат ли два изображения один и тот же текст.

public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)

Параметры

fullPath1 string

Путь к первому изображению.

fullPath2 string

Путь ко второму изображению.

settings RecognitionSettings

Настройки распознавания.

ignoreCase bool

True - означает нечувствительный к регистру поиск.

Возвращает

bool

True, если изображения имеют одинаковый текст (90% сходства).

CorrectSpelling(string, SpellCheckLanguage, string)

Корректирует текст (заменяет неправильно написанные слова).

public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)

Параметры

text string

Текст для исправления.

language SpellCheckLanguage

Словарь для использования.

dictionaryPath string

Опционально. Полный путь к пользовательскому словарю (словарь частот). Формат файла словаря: Текстовый файл в кодировке UTF-8. Слово и частота слова разделены пробелом или табуляцией. По умолчанию слово ожидается в первом столбце, а частота - во втором столбце. Каждая пара слово-частота на отдельной строке. Строка определяется как последовательность символов, за которой следует перевод строки ("\n"), возврат каретки ("\r"), или возврат каретки, за которым немедленно следует перевод строки("\r\n"). Каждое слово ожидается в нижнем регистре.

Возвращает

string

Текст с замененными словами.

DetectDefects(OcrInput, DefectType)

Автоматически находит проблемные области изображения, которые могут значительно повлиять на точность OCR. Поддерживает изображения PNG, JPEG, BMP, TIFF, JFIF и GIF, предоставленные в виде файла, потока или массива пикселей. Поддерживает массовое распознавание.

public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)

Параметры

images OcrInput

Исходные изображения Aspose.OCR.OcrInput

defectType DefectType

Типы дефектов, которые необходимо распознать Aspose.OCR.DefectType

Возвращает

List<DefectOutput&gt;

Обнаруженные дефекты изображения или пустая коллекция, если дефект не найден Aspose.OCR.DefectOutput.

DetectRectangles(OcrInput)

Обнаруживает текстовые области на изображениях. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.

public List<rectangleoutput> DetectRectangles(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

List<RectangleOutput&gt;

Список Aspose.OCR.RectangleOutput с обнаруженными текстовыми областями или строками.

DetectRectangles(OcrInput, AreasType, bool)

Обнаруживает текстовые области на изображениях. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.

public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

areasType AreasType

Определяет, какие прямоугольники возвращать - строки или абзацы.

detectAreas bool

Включает автоматическое обнаружение текстовых областей.

Возвращает

List<RectangleOutput&gt;

Список Aspose.OCR.RectangleOutput с обнаруженными текстовыми областями или строками.

ImageHasText(string, string, RecognitionSettings, bool, bool)

Проверяет, содержит ли изображение предоставленный текстовый фрагмент.

public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)

Параметры

fullPath string

Путь к изображению.

text string

Текстовый фрагмент для поиска на изображении.

settings RecognitionSettings

Настройки распознавания.

ignoreCase bool

True - означает нечувствительный к регистру поиск.

autoSkew bool

Включает автоматическую коррекцию наклона изображения.

Возвращает

bool

True, если изображение содержит текстовый фрагмент. False - изображение не содержит текстового фрагмента.

Примечания

Распознает изображение с возможностью указать Aspose.OCR.RecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF.

ImageHasText(string, Regex, RecognitionSettings, bool)

Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.

public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)

Параметры

fullPath string

Путь к изображению.

regex Regex

Объект System.Text.RegularExpressions с предоставленным шаблоном и параметрами.

settings RecognitionSettings

Настройки распознавания.

autoSkew bool

Включает автоматическую коррекцию наклона изображения.

Возвращает

bool

True, если текст изображения соответствует предоставленному регулярному выражению.

Примечания

Распознает изображение с возможностью указать Aspose.OCR.RecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF.

ImageTextDiff(string, string, RecognitionSettings, bool, bool)

Сравнивает тексты на двух изображениях и возвращает число, представляющее, насколько они похожи (от 0 до 1).

public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)

Параметры

fullPath1 string

Путь к первому изображению.

fullPath2 string

Путь ко второму изображению.

settings RecognitionSettings

Настройки распознавания.

ignoreCase bool

True - означает нечувствительный к регистру поиск.

autoSkew bool

Включает автоматическую коррекцию наклона изображения.

Возвращает

float

0 означает, что тексты совершенно разные; 1 означает, что тексты идентичны.

Recognize(OcrInput)

Распознает текст на изображениях / документах. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

public OcrOutput Recognize(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Recognize(OcrInput, RecognitionSettings, CancellationToken)

Распознает текст на изображениях / документах. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

settings RecognitionSettings

Настройки распознавания Aspose.OCR.RecognitionSettings.

cancellationToken CancellationToken

Объект CancellationToken.

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Recognize(OcrInput, RecognitionSettings)

Распознает текст на изображениях / документах. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

settings RecognitionSettings

Настройки распознавания Aspose.OCR.RecognitionSettings.

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

RecognizeCarPlate(OcrInput)

Распознает текст на номерном знаке автомобиля.

public OcrOutput RecognizeCarPlate(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Распознает номерные знаки автомобилей с возможностью указать Aspose.OCR.CarPlateRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

RecognizeCarPlate(OcrInput, CarPlateRecognitionSettings)

Распознает текст на номерном знаке автомобиля.

public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

settings CarPlateRecognitionSettings

Настройки распознавания Aspose.OCR.CarPlateRecognitionSettings.

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Распознает номерные знаки автомобилей с возможностью указать Aspose.OCR.CarPlateRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

RecognizeCharacters(OcrInput)

Обнаруживает символы на изображениях. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.

public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

List<CharacterRecognitionResult&gt;

Список Aspose.OCR.CharacterRecognitionResult с данными обнаруженных символов.

RecognizeCharacters(OcrInput, DetectAreasMode, Language)

Обнаруживает символы на изображениях. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.

public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

detectAreasMode DetectAreasMode

Определяет тип нейронной сети, используемой для обнаружения областей.

language Language

Язык, используемый для OCR.

Возвращает

List<CharacterRecognitionResult&gt;

Список Aspose.OCR.Character с данными обнаруженных символов.

RecognizeFast(OcrInput)

Распознает текст на изображениях / документах. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

public List<string> RecognizeFast(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

List<string&gt;

Список строк с результатами распознавания изображений.

RecognizeHandwrittenText(OcrInput)

Распознает рукописный текст на изображениях.

public OcrOutput RecognizeHandwrittenText(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

RecognizeIDCard(OcrInput)

Распознает текст на удостоверении личности.

public OcrOutput RecognizeIDCard(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Распознает удостоверения личности с возможностью указать Aspose.OCR.IDCardRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

RecognizeIDCard(OcrInput, IDCardRecognitionSettings)

Распознает текст на удостоверении личности.

public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

settings IDCardRecognitionSettings

Настройки распознавания Aspose.OCR.IDCardRecognitionSettings.

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Распознает удостоверения личности с возможностью указать Aspose.OCR.IDCardRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

RecognizeInvoice(OcrInput)

Распознает текст на счетах.

public OcrOutput RecognizeInvoice(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Распознает счета с возможностью указать Aspose.OCR.InvoiceRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)

Распознает текст на счетах.

public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

settings InvoiceRecognitionSettings

Настройки распознавания Aspose.OCR.InvoiceRecognitionSettings.

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Распознает счета с возможностью указать Aspose.OCR.InvoiceRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

RecognizeLines(OcrInput)

Распознает изображения, содержащие одну строку текста. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.

public OcrOutput RecognizeLines(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

RecognizeLines(OcrInput, RecognitionSettings)

Распознает изображения, содержащие одну строку текста. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.

public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

settings RecognitionSettings

Настройки распознавания Aspose.OCR.RecognitionSettings.

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

RecognizePassport(OcrInput)

Распознает текст на паспорте.

public OcrOutput RecognizePassport(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Распознает паспорта с возможностью указать Aspose.OCR.PassportRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

RecognizePassport(OcrInput, PassportRecognitionSettings)

Распознает текст на паспорте.

public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

settings PassportRecognitionSettings

Настройки распознавания Aspose.OCR.PassportRecognitionSettings.

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Распознает паспорта с возможностью указать Aspose.OCR.PassportRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

RecognizeReceipt(OcrInput)

Распознает текст на квитанциях.

public OcrOutput RecognizeReceipt(OcrInput images)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Распознает квитанции с возможностью указать Aspose.OCR.ReceiptRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

RecognizeReceipt(OcrInput, ReceiptRecognitionSettings)

Распознает текст на квитанциях.

public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)

Параметры

images OcrInput

Контейнер с источниками.Aspose.OCR.OcrInput

settings ReceiptRecognitionSettings

Настройки распознавания Aspose.OCR.ReceiptRecognitionSettings.

Возвращает

OcrOutput

Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.

Примечания

Распознает квитанции с возможностью указать Aspose.OCR.ReceiptRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.

SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)

Позволяет получить многослойный документ из списка объектов RecognitionResult

public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Параметры

fullFileName string

Имя файла с путем для сохранения результата распознавания в выбранном формате.

saveFormat SaveFormat

Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).

results List<RecognitionResult&gt;

Список объектов Aspose.OCR.RecognitionResult.

embeddedFontPath string

Опционально. Полный путь к пользовательскому шрифту.

optimizePdf PdfOptimizationMode

Снижает размер PDF-файла за счет уменьшения качества фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.

SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)

Позволяет получить многослойный документ из списка объектов RecognitionResult

public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Параметры

fullFileName string

Имя файла с путем для сохранения результата распознавания в выбранном формате.

saveFormat SaveFormat

Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).

results List<RecognitionResult&gt;

Список объектов Aspose.OCR.RecognitionResult.

applySpellingCorrection bool

Установите true, чтобы исправить неправильно написанные слова в случае, если такие есть в вашем результате распознавания.

language SpellCheckLanguage

Словарь для проверки правописания (опционально).

dictionaryPath string

Опционально. Полный путь к пользовательскому словарю в формате .txt. Формат [слово - пробел - частота (число)]. Пример: the 23135851162\nthat 3400031103\n

embeddedFontPath string

Опционально. Полный путь к пользовательскому шрифту.

optimizePdf PdfOptimizationMode

Снижает размер PDF-файла за счет уменьшения качества фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.

SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)

Позволяет получить многослойный документ из списка объектов RecognitionResult

public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Параметры

stream MemoryStream

MemoryStream для сохранения результата распознавания в выбранном формате.

saveFormat SaveFormat

Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).

results List<RecognitionResult&gt;

Список объектов Aspose.OCR.RecognitionResult.

embeddedFontPath string

Опционально. Полный путь к пользовательскому шрифту.

optimizePdf PdfOptimizationMode

Снижает размер PDF-файла за счет уменьшения качества фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.

SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)

Позволяет получить многослойный документ из списка объектов RecognitionResult

public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Параметры

stream MemoryStream

MemoryStream для сохранения результата распознавания в выбранном формате.

saveFormat SaveFormat

Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).

results List<RecognitionResult&gt;

Список объектов Aspose.OCR.RecognitionResult.

applySpellingCorrection bool

Установите true, чтобы исправить неправильно написанные слова в случае, если такие есть в вашем результате распознавания.

language SpellCheckLanguage

Словарь для проверки правописания (опционально).

dictionaryPath string

Опционально. Полный путь к пользовательскому словарю в формате .txt. Формат [слово - пробел - частота (число)]. Пример: the 23135851162\nthat 3400031103\n

embeddedFontPath string

Опционально. Полный путь к пользовательскому шрифту.

optimizePdf PdfOptimizationMode

Снижает размер PDF-файла за счет уменьшения качества фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.

OcrProgress

Событие для отслеживания прогресса распознавания многослойных изображений.

public event OcrRecognizeEventHandler OcrProgress

Тип События

OcrRecognizeEventHandler

 Русский