Class AsposeOcr
Namespace: Aspose.OCR
Assembly: Aspose.OCR.dll (25.1.0)
Основний API для бібліотеки Aspose OCR
public class AsposeOcr
Спадкування
Спадковані члени
object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Конструктори
AsposeOcr()
public AsposeOcr()
Методи
CalculateSkew(OcrInput)
Обчислює кути нахилу зображень.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.
public List<skewoutput> CalculateSkew(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
List<SkewOutput>
Список кутів нахилу в градусах Aspose.OCR.SkewOutput.
CompareImageTexts(string, string, RecognitionSettings, bool)
Перевіряє, чи містять два зображення один і той же текст.
public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)
Параметри
fullPath1
string
Шлях до першого зображення.
fullPath2
string
Шлях до другого зображення.
settings
RecognitionSettings
Налаштування розпізнавання.
ignoreCase
bool
True - означає нечутливий до регістру пошук.
Повертає
True, якщо зображення містять один і той же текст (90% схожості).
CorrectSpelling(string, SpellCheckLanguage, string)
Виправляє текст (замінює неправильно написані слова).
public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)
Параметри
text
string
Текст для виправлення.
language
SpellCheckLanguage
Словник для використання.
dictionaryPath
string
Необов’язково. Повний шлях до словника користувача (словник частоти).
Формат файлу словника:
Звичайний текстовий файл у кодуванні UTF-8.
Слово та частота слова розділені пробілом або табуляцією. За замовчуванням слово очікується в першому стовпці, а частота - у другому.
Кожна пара слово-частота в окремому рядку. Рядок визначається як послідовність символів, за якою слідує переведення рядка ("\n"), повернення каретки ("\r"),
або повернення каретки, безпосередньо за яким слідує переведення рядка("\r\n").
Кожне слово має бути в нижньому регістрі.
Повертає
Текст з заміненими словами.
DetectDefects(OcrInput, DefectType)
Автоматично знаходить проблемні зони зображення, які можуть значно вплинути на точність OCR.
Підтримує PNG, JPEG, BMP, TIFF, JFIF та GIF зображення, надані у вигляді файлу, потоку або масиву пікселів. Підтримує масове розпізнавання.
public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)
Параметри
images
OcrInput
Джерельні зображення Aspose.OCR.OcrInput
defectType
DefectType
Типи дефектів для розпізнавання Aspose.OCR.DefectType
Повертає
List<DefectOutput>
Виявлені дефекти зображення або порожня колекція, якщо дефект не знайдено Aspose.OCR.DefectOutput.
DetectRectangles(OcrInput)
Виявляє текстові області на зображеннях.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.
public List<rectangleoutput> DetectRectangles(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
List<RectangleOutput>
Список Aspose.OCR.RectangleOutput з виявленими текстовими областями або рядками.
DetectRectangles(OcrInput, AreasType, bool)
Виявляє текстові області на зображеннях.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.
public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
areasType
AreasType
Визначає, які прямокутники повертати - рядки чи абзаци.
detectAreas
bool
Увімкнути автоматичне виявлення текстових областей.
Повертає
List<RectangleOutput>
Список Aspose.OCR.RectangleOutput з виявленими текстовими областями або рядками.
ImageHasText(string, string, RecognitionSettings, bool, bool)
Перевіряє, чи містить зображення наданий фрагмент тексту.
public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Параметри
fullPath
string
Шлях до зображення.
text
string
Фрагмент тексту для пошуку на зображенні.
settings
RecognitionSettings
Налаштування розпізнавання.
ignoreCase
bool
True - означає нечутливий до регістру пошук.
autoSkew
bool
Увімкнення автоматичного виправлення нахилу зображення.
Повертає
True, якщо зображення містить фрагмент тексту. False - зображення не містить фрагмент тексту.
Примітки
Розпізнає зображення з можливістю вказати Aspose.OCR.RecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageHasText(string, Regex, RecognitionSettings, bool)
Перевіряє, чи відповідає текст зображення наданому регулярному виразу.
public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)
Параметри
fullPath
string
Шлях до зображення.
regex
Regex
Об’єкт System.Text.RegularExpressions з наданим шаблоном і параметрами.
settings
RecognitionSettings
Налаштування розпізнавання.
autoSkew
bool
Увімкнення автоматичного виправлення нахилу зображення.
Повертає
True, якщо текст зображення відповідає наданому регулярному виразу.
Примітки
Розпізнає зображення з можливістю вказати Aspose.OCR.RecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageTextDiff(string, string, RecognitionSettings, bool, bool)
Порівнює тексти на двох зображеннях і повертає число, що представляє, наскільки вони схожі (0 до 1).
public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Параметри
fullPath1
string
Шлях до першого зображення.
fullPath2
string
Шлях до другого зображення.
settings
RecognitionSettings
Налаштування розпізнавання.
ignoreCase
bool
True - означає нечутливий до регістру пошук.
autoSkew
bool
Увімкнення автоматичного виправлення нахилу зображення.
Повертає
0 означає, що тексти абсолютно різні; 1 означає, що тексти ідентичні.
Recognize(OcrInput)
Розпізнає текст на зображеннях / документах.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
public OcrOutput Recognize(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Recognize(OcrInput, RecognitionSettings, CancellationToken)
Розпізнає текст на зображеннях / документах.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
settings
RecognitionSettings
Налаштування розпізнавання Aspose.OCR.RecognitionSettings.
cancellationToken
CancellationToken
Об’єкт CancellationToken.
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Recognize(OcrInput, RecognitionSettings)
Розпізнає текст на зображеннях / документах.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
settings
RecognitionSettings
Налаштування розпізнавання Aspose.OCR.RecognitionSettings.
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
RecognizeCarPlate(OcrInput)
Розпізнає текст на номерних знаках автомобілів.
public OcrOutput RecognizeCarPlate(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Розпізнає номерні знаки автомобілів з можливістю вказати Aspose.OCR.CarPlateRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
RecognizeCarPlate(OcrInput, CarPlateRecognitionSettings)
Розпізнає текст на номерних знаках автомобілів.
public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
settings
CarPlateRecognitionSettings
Налаштування розпізнавання Aspose.OCR.CarPlateRecognitionSettings.
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Розпізнає номерні знаки автомобілів з можливістю вказати Aspose.OCR.CarPlateRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
RecognizeCharacters(OcrInput)
Виявляє символи на зображеннях.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
List<CharacterRecognitionResult>
Список Aspose.OCR.CharacterRecognitionResult з даними про виявлені символи.
RecognizeCharacters(OcrInput, DetectAreasMode, Language)
Виявляє символи на зображеннях.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
detectAreasMode
DetectAreasMode
Визначає тип нейронної мережі, що використовується для виявлення областей.
language
Language
Мова, що використовується для OCR.
Повертає
List<CharacterRecognitionResult>
Список Aspose.OCR.Character з даними про виявлені символи.
RecognizeFast(OcrInput)
Розпізнає текст на зображеннях / документах.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
public List<string> RecognizeFast(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
Список рядків з результатами розпізнавання зображення.
RecognizeHandwrittenText(OcrInput)
Розпізнає рукописний текст на зображеннях.
public OcrOutput RecognizeHandwrittenText(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
RecognizeIDCard(OcrInput)
Розпізнає текст на посвідченнях особи.
public OcrOutput RecognizeIDCard(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Розпізнає посвідчення особи з можливістю вказати Aspose.OCR.IDCardRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
RecognizeIDCard(OcrInput, IDCardRecognitionSettings)
Розпізнає текст на посвідченнях особи.
public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
settings
IDCardRecognitionSettings
Налаштування розпізнавання Aspose.OCR.IDCardRecognitionSettings.
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Розпізнає посвідчення особи з можливістю вказати Aspose.OCR.IDCardRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
RecognizeInvoice(OcrInput)
Розпізнає текст на рахунках.
public OcrOutput RecognizeInvoice(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Розпізнає рахунки з можливістю вказати Aspose.OCR.InvoiceRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
Розпізнає текст на рахунках.
public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
settings
InvoiceRecognitionSettings
Налаштування розпізнавання Aspose.OCR.InvoiceRecognitionSettings.
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Розпізнає рахунки з можливістю вказати Aspose.OCR.InvoiceRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
RecognizeLines(OcrInput)
Розпізнає зображення, які містять один рядок тексту.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.
public OcrOutput RecognizeLines(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
RecognizeLines(OcrInput, RecognitionSettings)
Розпізнає зображення, які містять один рядок тексту.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, папки, масиви, архіви.
public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
settings
RecognitionSettings
Налаштування розпізнавання Aspose.OCR.RecognitionSettings.
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
RecognizePassport(OcrInput)
Розпізнає текст на паспортах.
public OcrOutput RecognizePassport(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Розпізнає паспорти з можливістю вказати Aspose.OCR.PassportRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
RecognizePassport(OcrInput, PassportRecognitionSettings)
Розпізнає текст на паспортах.
public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
settings
PassportRecognitionSettings
Налаштування розпізнавання Aspose.OCR.PassportRecognitionSettings.
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Розпізнає паспорти з можливістю вказати Aspose.OCR.PassportRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
RecognizeReceipt(OcrInput)
Розпізнає текст на чеках.
public OcrOutput RecognizeReceipt(OcrInput images)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Розпізнає чеки з можливістю вказати Aspose.OCR.ReceiptRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
RecognizeReceipt(OcrInput, ReceiptRecognitionSettings)
Розпізнає текст на чеках.
public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)
Параметри
images
OcrInput
Контейнер з джерелами.Aspose.OCR.OcrInput
settings
ReceiptRecognitionSettings
Налаштування розпізнавання Aspose.OCR.ReceiptRecognitionSettings.
Повертає
Список об’єктів Aspose.OCR.RecognitionResult з результатами розпізнавання зображення.
Примітки
Розпізнає чеки з можливістю вказати Aspose.OCR.ReceiptRecognitionSettings.
Підтримує GIF, PNG, JPEG, BMP, TIFF, JFIF, потоки, каталоги, масиви, архіви.
SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)
Дозволяє отримати багатосторінковий документ з списку об’єктів RecognitionResult
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Параметри
fullFileName
string
Ім’я файлу з шляхом для збереження результату розпізнавання у вибраному форматі.
saveFormat
SaveFormat
Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Список об’єктів Aspose.OCR.RecognitionResult.
embeddedFontPath
string
Необов’язково. Повний шлях до шрифту користувача.
optimizePdf
PdfOptimizationMode
Зменшує розмір PDF-файлу, знижуючи якість фонових зображень. За замовчуванням зберігається оригінальна якість зображення.
SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Дозволяє отримати багатосторінковий документ з списку об’єктів RecognitionResult
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Параметри
fullFileName
string
Ім’я файлу з шляхом для збереження результату розпізнавання у вибраному форматі.
saveFormat
SaveFormat
Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Список об’єктів Aspose.OCR.RecognitionResult.
applySpellingCorrection
bool
Встановіть true, щоб виправити неправильно написані слова, якщо такі є у вашому результаті розпізнавання.
language
SpellCheckLanguage
Словник для перевірки правопису (необов’язково).
dictionaryPath
string
Необов’язково. Повний шлях до словника користувача у форматі .txt. Формат [слово - пробіл - частота (число)].
Приклад: the 23135851162\nthat 3400031103\n
embeddedFontPath
string
Необов’язково. Повний шлях до шрифту користувача.
optimizePdf
PdfOptimizationMode
Зменшує розмір PDF-файлу, знижуючи якість фонових зображень. За замовчуванням зберігається оригінальна якість зображення.
SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)
Дозволяє отримати багатосторінковий документ з списку об’єктів RecognitionResult
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Параметри
stream
MemoryStream
MemoryStream для збереження результату розпізнавання у вибраному форматі.
saveFormat
SaveFormat
Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Список об’єктів Aspose.OCR.RecognitionResult.
embeddedFontPath
string
Необов’язково. Повний шлях до шрифту користувача.
optimizePdf
PdfOptimizationMode
Зменшує розмір PDF-файлу, знижуючи якість фонових зображень. За замовчуванням зберігається оригінальна якість зображення.
SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Дозволяє отримати багатосторінковий документ з списку об’єктів RecognitionResult
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Параметри
stream
MemoryStream
MemoryStream для збереження результату розпізнавання у вибраному форматі.
saveFormat
SaveFormat
Формат документа (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Список об’єктів Aspose.OCR.RecognitionResult.
applySpellingCorrection
bool
Встановіть true, щоб виправити неправильно написані слова, якщо такі є у вашому результаті розпізнавання.
language
SpellCheckLanguage
Словник для перевірки правопису (необов’язково).
dictionaryPath
string
Необов’язково. Повний шлях до словника користувача у форматі .txt. Формат [слово - пробіл - частота (число)].
Приклад: the 23135851162\nthat 3400031103\n
embeddedFontPath
string
Необов’язково. Повний шлях до шрифту користувача.
optimizePdf
PdfOptimizationMode
Зменшує розмір PDF-файлу, знижуючи якість фонових зображень. За замовчуванням зберігається оригінальна якість зображення.
OcrProgress
Подія для відстеження прогресу розпізнавання багатосторінкового зображення.
public event OcrRecognizeEventHandler OcrProgress