Class AsposeOcr

Class AsposeOcr

Namespace: Aspose.OCR
Assembly: Aspose.OCR.dll (25.1.0)

Основний API для бібліотеки Aspose OCR

public class AsposeOcr

Спадкування

objectAsposeOcr

Спадковані члени

object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Конструктори

AsposeOcr()

public AsposeOcr()

Методи

CalculateSkew(OcrInput)

Обчислює кути нахилу зображень.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.

public List<skewoutput> CalculateSkew(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

List<SkewOutput&gt;

Список кутів нахилу в градусах Aspose.OCR.SkewOutput.

CompareImageTexts(string, string, RecognitionSettings, bool)

Перевіряє, чи містять два зображення один і той же текст.

public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)

Параметри

fullPath1 string

Шлях до першого зображення.

fullPath2 string

Шлях до другого зображення.

settings RecognitionSettings

Налаштування розпізнавання.

ignoreCase bool

True - означає нечутливий до регістру пошук.

Повертає

bool

True, якщо зображення містять один і той же текст (90% схожості).

CorrectSpelling(string, SpellCheckLanguage, string)

Виправляє текст (замінює неправильно написані слова).

public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)

Параметри

text string

Текст для виправлення.

language SpellCheckLanguage

Словник для використання.

dictionaryPath string

Необов’язково. Повний шлях до словника користувача (словник частоти).
Формат файлу словника:
Звичайний текстовий файл у кодуванні UTF-8.
Слово та частота слова розділені пробілом або табуляцією. За замовчуванням слово очікується в першому стовпці, а частота - у другому.
Кожна пара слово-частота в окремому рядку. Рядок визначається як послідовність символів, за якою слідує переведення рядка ("\n"), повернення каретки ("\r"),
або повернення каретки, безпосередньо за яким слідує переведення рядка("\r\n").
Кожне слово має бути в нижньому регістрі.

Повертає

string

Текст з заміненими словами.

DetectDefects(OcrInput, DefectType)

Автоматично знаходить проблемні зони зображення, які можуть значно вплинути на точність OCR.
Підтримує PNG, JPEG, BMP, TIFF, JFIF та GIF зображення, надані у вигляді файлу, потоку або масиву пікселів. Підтримує масове розпізнавання.

public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)

Параметри

images OcrInput

Джерельні зображення Aspose.OCR.OcrInput

defectType DefectType

Типи дефектів для розпізнавання Aspose.OCR.DefectType

Повертає

List<DefectOutput&gt;

Виявлені дефекти зображення або порожня колекція, якщо дефект не знайдено Aspose.OCR.DefectOutput.

DetectRectangles(OcrInput)

Виявляє текстові області на зображеннях.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.

public List<rectangleoutput> DetectRectangles(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

List<RectangleOutput&gt;

Список Aspose.OCR.RectangleOutput з виявленими текстовими областями або рядками.

DetectRectangles(OcrInput, AreasType, bool)

Виявляє текстові області на зображеннях.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.

public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

areasType AreasType

Визначає, які прямокутники повертати - рядки чи абзаци.

detectAreas bool

Увімкнути автоматичне виявлення текстових областей.

Повертає

List<RectangleOutput&gt;

Список Aspose.OCR.RectangleOutput з виявленими текстовими областями або рядками.

ImageHasText(string, string, RecognitionSettings, bool, bool)

Перевіряє, чи містить зображення наданий фрагмент тексту.

public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)

Параметри

fullPath string

Шлях до зображення.

text string

Фрагмент тексту для пошуку на зображенні.

settings RecognitionSettings

Налаштування розпізнавання.

ignoreCase bool

True - означає нечутливий до регістру пошук.

autoSkew bool

Увімкнення автоматичного виправлення нахилу зображення.

Повертає

bool

True, якщо зображення містить фрагмент тексту. False - зображення не містить фрагмент тексту.

Примітки

Розпізнає зображення з можливістю вказати Aspose.OCR.RecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF.

ImageHasText(string, Regex, RecognitionSettings, bool)

Перевіряє, чи відповідає текст зображення наданому регулярному виразу.

public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)

Параметри

fullPath string

Шлях до зображення.

regex Regex

Об’єкт System.Text.RegularExpressions з наданим шаблоном і параметрами.

settings RecognitionSettings

Налаштування розпізнавання.

autoSkew bool

Увімкнення автоматичного виправлення нахилу зображення.

Повертає

bool

True, якщо текст зображення відповідає наданому регулярному виразу.

Примітки

Розпізнає зображення з можливістю вказати Aspose.OCR.RecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF.

ImageTextDiff(string, string, RecognitionSettings, bool, bool)

Порівнює тексти на двох зображеннях і повертає число, що представляє, наскільки вони схожі (0 до 1).

public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)

Параметри

fullPath1 string

Шлях до першого зображення.

fullPath2 string

Шлях до другого зображення.

settings RecognitionSettings

Налаштування розпізнавання.

ignoreCase bool

True - означає нечутливий до регістру пошук.

autoSkew bool

Увімкнення автоматичного виправлення нахилу зображення.

Повертає

float

0 означає, що тексти абсолютно різні; 1 означає, що тексти ідентичні.

Recognize(OcrInput)

Розпізнає текст на зображеннях / документах.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

public OcrOutput Recognize(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Recognize(OcrInput, RecognitionSettings, CancellationToken)

Розпізнає текст на зображеннях / документах.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

settings RecognitionSettings

Налаштування розпізнавання Aspose.OCR.RecognitionSettings.

cancellationToken CancellationToken

Об’єкт CancellationToken.

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Recognize(OcrInput, RecognitionSettings)

Розпізнає текст на зображеннях / документах.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

settings RecognitionSettings

Налаштування розпізнавання Aspose.OCR.RecognitionSettings.

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

RecognizeCarPlate(OcrInput)

Розпізнає текст на номерних знаках автомобілів.

public OcrOutput RecognizeCarPlate(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Розпізнає номерні знаки автомобілів з можливістю вказати Aspose.OCR.CarPlateRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

RecognizeCarPlate(OcrInput, CarPlateRecognitionSettings)

Розпізнає текст на номерних знаках автомобілів.

public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

settings CarPlateRecognitionSettings

Налаштування розпізнавання Aspose.OCR.CarPlateRecognitionSettings.

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Розпізнає номерні знаки автомобілів з можливістю вказати Aspose.OCR.CarPlateRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

RecognizeCharacters(OcrInput)

Виявляє символи на зображеннях.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.

public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

List<CharacterRecognitionResult&gt;

Список Aspose.OCR.CharacterRecognitionResult з даними про виявлені символи.

RecognizeCharacters(OcrInput, DetectAreasMode, Language)

Виявляє символи на зображеннях.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.

public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

detectAreasMode DetectAreasMode

Визначає тип нейронної мережі, що використовується для виявлення областей.

language Language

Мова, що використовується для OCR.

Повертає

List<CharacterRecognitionResult&gt;

Список Aspose.OCR.Character з даними про виявлені символи.

RecognizeFast(OcrInput)

Розпізнає текст на зображеннях / документах.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

public List<string> RecognizeFast(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

List<string&gt;

Список рядків з результатами розпізнавання зображення.

RecognizeHandwrittenText(OcrInput)

Розпізнає рукописний текст на зображеннях.

public OcrOutput RecognizeHandwrittenText(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

RecognizeIDCard(OcrInput)

Розпізнає текст на посвідченнях особи.

public OcrOutput RecognizeIDCard(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Розпізнає посвідчення особи з можливістю вказати Aspose.OCR.IDCardRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

RecognizeIDCard(OcrInput, IDCardRecognitionSettings)

Розпізнає текст на посвідченнях особи.

public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

settings IDCardRecognitionSettings

Налаштування розпізнавання Aspose.OCR.IDCardRecognitionSettings.

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Розпізнає посвідчення особи з можливістю вказати Aspose.OCR.IDCardRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

RecognizeInvoice(OcrInput)

Розпізнає текст на рахунках.

public OcrOutput RecognizeInvoice(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Розпізнає рахунки з можливістю вказати Aspose.OCR.InvoiceRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)

Розпізнає текст на рахунках.

public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

settings InvoiceRecognitionSettings

Налаштування розпізнавання Aspose.OCR.InvoiceRecognitionSettings.

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Розпізнає рахунки з можливістю вказати Aspose.OCR.InvoiceRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

RecognizeLines(OcrInput)

Розпізнає зображення, які містять один рядок тексту.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.

public OcrOutput RecognizeLines(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

RecognizeLines(OcrInput, RecognitionSettings)

Розпізнає зображення, які містять один рядок тексту.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.

public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

settings RecognitionSettings

Налаштування розпізнавання Aspose.OCR.RecognitionSettings.

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

RecognizePassport(OcrInput)

Розпізнає текст на паспортах.

public OcrOutput RecognizePassport(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Розпізнає паспорти з можливістю вказати Aspose.OCR.PassportRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

RecognizePassport(OcrInput, PassportRecognitionSettings)

Розпізнає текст на паспортах.

public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

settings PassportRecognitionSettings

Налаштування розпізнавання Aspose.OCR.PassportRecognitionSettings.

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Розпізнає паспорти з можливістю вказати Aspose.OCR.PassportRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

RecognizeReceipt(OcrInput)

Розпізнає текст на чеках.

public OcrOutput RecognizeReceipt(OcrInput images)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Розпізнає чеки з можливістю вказати Aspose.OCR.ReceiptRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

RecognizeReceipt(OcrInput, ReceiptRecognitionSettings)

Розпізнає текст на чеках.

public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)

Параметри

images OcrInput

Контейнер з джерелами.Aspose.OCR.OcrInput

settings ReceiptRecognitionSettings

Налаштування розпізнавання Aspose.OCR.ReceiptRecognitionSettings.

Повертає

OcrOutput

Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.

Примітки

Розпізнає чеки з можливістю вказати Aspose.OCR.ReceiptRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.

SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)

Дозволяє отримати багатосторінковий документ з списку об’єктів RecognitionResult

public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Параметри

fullFileName string

Ім’я файлу з шляхом для збереження результату розпізнавання у вибраному форматі.

saveFormat SaveFormat

Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).

results List<RecognitionResult&gt;

Список об’єктів Aspose.OCR.RecognitionResult.

embeddedFontPath string

Необов’язково. Повний шлях до шрифту користувача.

optimizePdf PdfOptimizationMode

Зменшує розмір PDF-файлу, знижуючи якість фонових зображень. За замовчуванням зберігається оригінальна якість зображення.

SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)

Дозволяє отримати багатосторінковий документ з списку об’єктів RecognitionResult

public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Параметри

fullFileName string

Ім’я файлу з шляхом для збереження результату розпізнавання у вибраному форматі.

saveFormat SaveFormat

Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).

results List<RecognitionResult&gt;

Список об’єктів Aspose.OCR.RecognitionResult.

applySpellingCorrection bool

Встановіть true, щоб виправити неправильно написані слова, якщо такі є у вашому результаті розпізнавання.

language SpellCheckLanguage

Словник для перевірки правопису (необов’язково).

dictionaryPath string

Необов’язково. Повний шлях до словника користувача у форматі .txt. Формат [слово - пробіл - частота (число)].
Приклад: the 23135851162\nthat 3400031103\n

embeddedFontPath string

Необов’язково. Повний шлях до шрифту користувача.

optimizePdf PdfOptimizationMode

Зменшує розмір PDF-файлу, знижуючи якість фонових зображень. За замовчуванням зберігається оригінальна якість зображення.

SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)

Дозволяє отримати багатосторінковий документ з списку об’єктів RecognitionResult

public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Параметри

stream MemoryStream

MemoryStream для збереження результату розпізнавання у вибраному форматі.

saveFormat SaveFormat

Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).

results List<RecognitionResult&gt;

Список об’єктів Aspose.OCR.RecognitionResult.

embeddedFontPath string

Необов’язково. Повний шлях до шрифту користувача.

optimizePdf PdfOptimizationMode

Зменшує розмір PDF-файлу, знижуючи якість фонових зображень. За замовчуванням зберігається оригінальна якість зображення.

SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)

Дозволяє отримати багатосторінковий документ з списку об’єктів RecognitionResult

public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Параметри

stream MemoryStream

MemoryStream для збереження результату розпізнавання у вибраному форматі.

saveFormat SaveFormat

Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).

results List<RecognitionResult&gt;

Список об’єктів Aspose.OCR.RecognitionResult.

applySpellingCorrection bool

Встановіть true, щоб виправити неправильно написані слова, якщо такі є у вашому результаті розпізнавання.

language SpellCheckLanguage

Словник для перевірки правопису (необов’язково).

dictionaryPath string

Необов’язково. Повний шлях до словника користувача у форматі .txt. Формат [слово - пробіл - частота (число)].
Приклад: the 23135851162\nthat 3400031103\n

embeddedFontPath string

Необов’язково. Повний шлях до шрифту користувача.

optimizePdf PdfOptimizationMode

Зменшує розмір PDF-файлу, знижуючи якість фонових зображень. За замовчуванням зберігається оригінальна якість зображення.

OcrProgress

Подія для відстеження прогресу розпізнавання багатосторінкового зображення.

public event OcrRecognizeEventHandler OcrProgress

Тип події

OcrRecognizeEventHandler

 Українська