Class AsposeOcr
Namespace: Aspose.OCR
Assembly: Aspose.OCR.dll (25.1.0)
Основной API для библиотеки Aspose OCR
public class AsposeOcr
Наследование
Унаследованные Члены
object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Конструкторы
AsposeOcr()
public AsposeOcr()
Методы
CalculateSkew(OcrInput)
Вычисляет углы наклона изображений. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.
public List<skewoutput> CalculateSkew(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
List<SkewOutput>
Список углов наклона в градусах Aspose.OCR.SkewOutput.
CompareImageTexts(string, string, RecognitionSettings, bool)
Проверяет, содержат ли два изображения один и тот же текст.
public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)
Параметры
fullPath1
string
Путь к первому изображению.
fullPath2
string
Путь ко второму изображению.
settings
RecognitionSettings
Настройки распознавания.
ignoreCase
bool
True - означает нечувствительный к регистру поиск.
Возвращает
True, если изображения имеют одинаковый текст (90% сходства).
CorrectSpelling(string, SpellCheckLanguage, string)
Корректирует текст (заменяет неправильно написанные слова).
public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)
Параметры
text
string
Текст для исправления.
language
SpellCheckLanguage
Словарь для использования.
dictionaryPath
string
Опционально. Полный путь к пользовательскому словарю (словарь частот). Формат файла словаря: Текстовый файл в кодировке UTF-8. Слово и частота слова разделены пробелом или табуляцией. По умолчанию слово ожидается в первом столбце, а частота - во втором столбце. Каждая пара слово-частота на отдельной строке. Строка определяется как последовательность символов, за которой следует перевод строки ("\n"), возврат каретки ("\r"), или возврат каретки, за которым немедленно следует перевод строки("\r\n"). Каждое слово ожидается в нижнем регистре.
Возвращает
Текст с замененными словами.
DetectDefects(OcrInput, DefectType)
Автоматически находит проблемные области изображения, которые могут значительно повлиять на точность OCR. Поддерживает изображения PNG, JPEG, BMP, TIFF, JFIF и GIF, предоставленные в виде файла, потока или массива пикселей. Поддерживает массовое распознавание.
public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)
Параметры
images
OcrInput
Исходные изображения Aspose.OCR.OcrInput
defectType
DefectType
Типы дефектов, которые необходимо распознать Aspose.OCR.DefectType
Возвращает
List<DefectOutput>
Обнаруженные дефекты изображения или пустая коллекция, если дефект не найден Aspose.OCR.DefectOutput.
DetectRectangles(OcrInput)
Обнаруживает текстовые области на изображениях. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.
public List<rectangleoutput> DetectRectangles(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
List<RectangleOutput>
Список Aspose.OCR.RectangleOutput с обнаруженными текстовыми областями или строками.
DetectRectangles(OcrInput, AreasType, bool)
Обнаруживает текстовые области на изображениях. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.
public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
areasType
AreasType
Определяет, какие прямоугольники возвращать - строки или абзацы.
detectAreas
bool
Включает автоматическое обнаружение текстовых областей.
Возвращает
List<RectangleOutput>
Список Aspose.OCR.RectangleOutput с обнаруженными текстовыми областями или строками.
ImageHasText(string, string, RecognitionSettings, bool, bool)
Проверяет, содержит ли изображение предоставленный текстовый фрагмент.
public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Параметры
fullPath
string
Путь к изображению.
text
string
Текстовый фрагмент для поиска на изображении.
settings
RecognitionSettings
Настройки распознавания.
ignoreCase
bool
True - означает нечувствительный к регистру поиск.
autoSkew
bool
Включает автоматическую коррекцию наклона изображения.
Возвращает
True, если изображение содержит текстовый фрагмент. False - изображение не содержит текстового фрагмента.
Примечания
Распознает изображение с возможностью указать Aspose.OCR.RecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageHasText(string, Regex, RecognitionSettings, bool)
Проверяет, соответствует ли текст изображения предоставленному регулярному выражению.
public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)
Параметры
fullPath
string
Путь к изображению.
regex
Regex
Объект System.Text.RegularExpressions с предоставленным шаблоном и параметрами.
settings
RecognitionSettings
Настройки распознавания.
autoSkew
bool
Включает автоматическую коррекцию наклона изображения.
Возвращает
True, если текст изображения соответствует предоставленному регулярному выражению.
Примечания
Распознает изображение с возможностью указать Aspose.OCR.RecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageTextDiff(string, string, RecognitionSettings, bool, bool)
Сравнивает тексты на двух изображениях и возвращает число, представляющее, насколько они похожи (от 0 до 1).
public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Параметры
fullPath1
string
Путь к первому изображению.
fullPath2
string
Путь ко второму изображению.
settings
RecognitionSettings
Настройки распознавания.
ignoreCase
bool
True - означает нечувствительный к регистру поиск.
autoSkew
bool
Включает автоматическую коррекцию наклона изображения.
Возвращает
0 означает, что тексты совершенно разные; 1 означает, что тексты идентичны.
Recognize(OcrInput)
Распознает текст на изображениях / документах. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
public OcrOutput Recognize(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Recognize(OcrInput, RecognitionSettings, CancellationToken)
Распознает текст на изображениях / документах. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
settings
RecognitionSettings
Настройки распознавания Aspose.OCR.RecognitionSettings.
cancellationToken
CancellationToken
Объект CancellationToken.
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Recognize(OcrInput, RecognitionSettings)
Распознает текст на изображениях / документах. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
settings
RecognitionSettings
Настройки распознавания Aspose.OCR.RecognitionSettings.
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
RecognizeCarPlate(OcrInput)
Распознает текст на номерном знаке автомобиля.
public OcrOutput RecognizeCarPlate(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Распознает номерные знаки автомобилей с возможностью указать Aspose.OCR.CarPlateRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
RecognizeCarPlate(OcrInput, CarPlateRecognitionSettings)
Распознает текст на номерном знаке автомобиля.
public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
settings
CarPlateRecognitionSettings
Настройки распознавания Aspose.OCR.CarPlateRecognitionSettings.
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Распознает номерные знаки автомобилей с возможностью указать Aspose.OCR.CarPlateRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
RecognizeCharacters(OcrInput)
Обнаруживает символы на изображениях. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
List<CharacterRecognitionResult>
Список Aspose.OCR.CharacterRecognitionResult с данными обнаруженных символов.
RecognizeCharacters(OcrInput, DetectAreasMode, Language)
Обнаруживает символы на изображениях. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
detectAreasMode
DetectAreasMode
Определяет тип нейронной сети, используемой для обнаружения областей.
language
Language
Язык, используемый для OCR.
Возвращает
List<CharacterRecognitionResult>
Список Aspose.OCR.Character с данными обнаруженных символов.
RecognizeFast(OcrInput)
Распознает текст на изображениях / документах. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
public List<string> RecognizeFast(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
Список строк с результатами распознавания изображений.
RecognizeHandwrittenText(OcrInput)
Распознает рукописный текст на изображениях.
public OcrOutput RecognizeHandwrittenText(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
RecognizeIDCard(OcrInput)
Распознает текст на удостоверении личности.
public OcrOutput RecognizeIDCard(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Распознает удостоверения личности с возможностью указать Aspose.OCR.IDCardRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
RecognizeIDCard(OcrInput, IDCardRecognitionSettings)
Распознает текст на удостоверении личности.
public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
settings
IDCardRecognitionSettings
Настройки распознавания Aspose.OCR.IDCardRecognitionSettings.
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Распознает удостоверения личности с возможностью указать Aspose.OCR.IDCardRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
RecognizeInvoice(OcrInput)
Распознает текст на счетах.
public OcrOutput RecognizeInvoice(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Распознает счета с возможностью указать Aspose.OCR.InvoiceRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
Распознает текст на счетах.
public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
settings
InvoiceRecognitionSettings
Настройки распознавания Aspose.OCR.InvoiceRecognitionSettings.
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Распознает счета с возможностью указать Aspose.OCR.InvoiceRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
RecognizeLines(OcrInput)
Распознает изображения, содержащие одну строку текста. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.
public OcrOutput RecognizeLines(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
RecognizeLines(OcrInput, RecognitionSettings)
Распознает изображения, содержащие одну строку текста. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, папку, массивы, архивы.
public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
settings
RecognitionSettings
Настройки распознавания Aspose.OCR.RecognitionSettings.
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
RecognizePassport(OcrInput)
Распознает текст на паспорте.
public OcrOutput RecognizePassport(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Распознает паспорта с возможностью указать Aspose.OCR.PassportRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
RecognizePassport(OcrInput, PassportRecognitionSettings)
Распознает текст на паспорте.
public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
settings
PassportRecognitionSettings
Настройки распознавания Aspose.OCR.PassportRecognitionSettings.
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Распознает паспорта с возможностью указать Aspose.OCR.PassportRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
RecognizeReceipt(OcrInput)
Распознает текст на квитанциях.
public OcrOutput RecognizeReceipt(OcrInput images)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Распознает квитанции с возможностью указать Aspose.OCR.ReceiptRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
RecognizeReceipt(OcrInput, ReceiptRecognitionSettings)
Распознает текст на квитанциях.
public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)
Параметры
images
OcrInput
Контейнер с источниками.Aspose.OCR.OcrInput
settings
ReceiptRecognitionSettings
Настройки распознавания Aspose.OCR.ReceiptRecognitionSettings.
Возвращает
Список объектов Aspose.OCR.RecognitionResult с результатами распознавания изображений.
Примечания
Распознает квитанции с возможностью указать Aspose.OCR.ReceiptRecognitionSettings. Поддерживает GIF, PNG, JPEG, BMP, TIFF, JFIF, поток, каталог, массивы, архивы.
SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)
Позволяет получить многослойный документ из списка объектов RecognitionResult
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Параметры
fullFileName
string
Имя файла с путем для сохранения результата распознавания в выбранном формате.
saveFormat
SaveFormat
Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Список объектов Aspose.OCR.RecognitionResult.
embeddedFontPath
string
Опционально. Полный путь к пользовательскому шрифту.
optimizePdf
PdfOptimizationMode
Снижает размер PDF-файла за счет уменьшения качества фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.
SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Позволяет получить многослойный документ из списка объектов RecognitionResult
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Параметры
fullFileName
string
Имя файла с путем для сохранения результата распознавания в выбранном формате.
saveFormat
SaveFormat
Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Список объектов Aspose.OCR.RecognitionResult.
applySpellingCorrection
bool
Установите true, чтобы исправить неправильно написанные слова в случае, если такие есть в вашем результате распознавания.
language
SpellCheckLanguage
Словарь для проверки правописания (опционально).
dictionaryPath
string
Опционально. Полный путь к пользовательскому словарю в формате .txt. Формат [слово - пробел - частота (число)]. Пример: the 23135851162\nthat 3400031103\n
embeddedFontPath
string
Опционально. Полный путь к пользовательскому шрифту.
optimizePdf
PdfOptimizationMode
Снижает размер PDF-файла за счет уменьшения качества фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.
SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)
Позволяет получить многослойный документ из списка объектов RecognitionResult
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Параметры
stream
MemoryStream
MemoryStream для сохранения результата распознавания в выбранном формате.
saveFormat
SaveFormat
Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Список объектов Aspose.OCR.RecognitionResult.
embeddedFontPath
string
Опционально. Полный путь к пользовательскому шрифту.
optimizePdf
PdfOptimizationMode
Снижает размер PDF-файла за счет уменьшения качества фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.
SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Позволяет получить многослойный документ из списка объектов RecognitionResult
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Параметры
stream
MemoryStream
MemoryStream для сохранения результата распознавания в выбранном формате.
saveFormat
SaveFormat
Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Список объектов Aspose.OCR.RecognitionResult.
applySpellingCorrection
bool
Установите true, чтобы исправить неправильно написанные слова в случае, если такие есть в вашем результате распознавания.
language
SpellCheckLanguage
Словарь для проверки правописания (опционально).
dictionaryPath
string
Опционально. Полный путь к пользовательскому словарю в формате .txt. Формат [слово - пробел - частота (число)]. Пример: the 23135851162\nthat 3400031103\n
embeddedFontPath
string
Опционально. Полный путь к пользовательскому шрифту.
optimizePdf
PdfOptimizationMode
Снижает размер PDF-файла за счет уменьшения качества фоновых изображений. По умолчанию сохраняется оригинальное качество изображения.
OcrProgress
Событие для отслеживания прогресса распознавания многослойных изображений.
public event OcrRecognizeEventHandler OcrProgress