Class AsposeOcr

Class AsposeOcr

Името на пространството: Aspose.OCR Асамблея: Aspose.OCR.dll (25.4.0)

Основна API за ASPOSE OCR библиотека

public class AsposeOcr : IDisposable

Inheritance

object AsposeOcr

Implements

IDisposable

наследници

object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()

Constructors

AsposeOcr()

public AsposeOcr()

Methods

CalculateSkew(OcrInput)

Изчислява ъглите на изображението.GIF, PNG, JPEG, BMP, TIFF, JFIF.

public List<skewoutput> CalculateSkew(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

List < SkewOutput >

Aspose.OCR.SkewOutput.

CompareImageTexts(string, string, разпознаванеSettings, bool)

Проверете дали две изображения съдържат един и същ текст.

public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)

Parameters

fullPath1 string

Пътят към първата картина.

fullPath2 string

Пътят към втората картина.

settings RecognitionSettings

Настройки за разпознаване.

ignoreCase bool

Истински - означава случайно нечувствително търсене.

Returns

bool

Вярно е, ако изображенията имат същия текст (90% сходство).

CorrectSpelling(Стринг, SpellCheckLanguage, Стринг)

Правилният текст (заменя неправилните думи).

public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)

Parameters

text string

Текст за корекция.

language SpellCheckLanguage

Речник за използване.

dictionaryPath string

Пълният път към речника на потребителя (речник на честотата).Файл формат на речник:Пълно текстови файлове в UTF-8 кодиране.По подразбиране, думата се очаква в първата колона и честотата в втората.Всяка дума-честотна двойка в отделна линия.Линкът е дефиниран като последователност от знаци, следвана от линията ("\n"), връщането на превозното средство („\r"),или връщане на превоз незабавно, следвано от линия ("\r\n").Всяка дума се очаква да бъде в по-ниски случаи.

Returns

string

Текст с замествани думи.

DetectDefects(Оригинално име: DefectType)

Автоматично намиране на проблематични области на изображението, които могат значително да повлияят на точността на OCR.Поддържа PNG, JPEG, BMP, TIFF, JFIF и GIF изображения, предоставени като файл, поток или пикселен диапазон.

public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)

Parameters

images OcrInput

Източник на изображения Aspose.OCR.OcrInput

defectType DefectType

Видове дефекти, които трябва да бъдат разпознати Aspose.OCR.DefectType

Returns

List < DefectOutput >

Открити дефекти на изображението или аб празна колекция, ако не е намерена грешка Aspose.OCR.DefectOutput.

DetectDocumentLayout(OcrInput)

Анализира изображението и идентифицира различните видове области на съдържанието в него.Поддържа PNG, JPEG, BMP, TIFF, JFIF и GIF изображения от файлове, потоци и пикселни рамки.

public List<layoutoutput> DetectDocumentLayout(OcrInput images)

Parameters

images OcrInput

Източник на изображения.Aspose.OCR.OcrInput

Returns

List < LayoutOutput >

Aspose.OCR.LayoutOutput.

DetectLanguages(OcrInput)

Анализира текста на изображението, за да определи езиците, в които е написано.Това ви позволява да изберете най-подходящия език за разпознаване и помага при по-нататъшни задачи за обработка на текст, като например spellchecking или превод.

public List<languagedetectionoutput> DetectLanguages(OcrInput images)

Parameters

images OcrInput

Източник на изображения Aspose.OCR.OcrInput

Returns

List < LanguageDetectionOutput >

Aspose.OCR.LanguageDetectionOutput.

DetectRectangles(OcrInput)

Открива текстови области на изображенията.GIF, PNG, JPEG, BMP, TIFF, JFIF.

[Obsolete("Will be removed in the release 25.8.0")]
public List<rectangleoutput> DetectRectangles(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

List < RectangleOutput >

Aspose.OCR.RectangleOutput.

DetectRectangles(Оригинално име: AreasType, Bool)

Открива текстови области на изображенията.GIF, PNG, JPEG, BMP, TIFF, JFIF.

public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

areasType AreasType

Определя въртящи се правоъгълници - линия или параграфи.

detectAreas bool

Възможност за автоматично откриване на текстови области.

Returns

List < RectangleOutput >

Aspose.OCR.RectangleOutput.

Dispose()

Определени ресурси за признаване.

public void Dispose()

ImageHasText(string, string, разпознаванеSettings, bool, bool)

Проверете дали изображението съдържа предоставения текст фрагмент.

public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)

Parameters

fullPath string

Пътят към изображението.

text string

Текст фрагмент за търсене на изображението.

settings RecognitionSettings

Настройки за разпознаване.

ignoreCase bool

Истински - означава случайно нечувствително търсене.

autoSkew bool

Осигурява автоматична корекция на изображението.

Returns

bool

Вярно е, ако изображението съдържа фрагмент от текст. Фалшива - снимката не съдържа текстови части.

Remarks

Aspose.OCR.RecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

ImageHasText(String, Regex, Настройки за разпознаване, Bool)

Проверете дали текстът на изображението съответства на предоставения редовен израз.

public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)

Parameters

fullPath string

Пътят към изображението.

regex Regex

System.Text.RegularExpressions.

settings RecognitionSettings

Настройки за разпознаване.

autoSkew bool

Осигурява автоматична корекция на изображението.

Returns

bool

Вярно е, ако текстът на изображението съответства на предоставения редовен израз.

Remarks

Aspose.OCR.RecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

ImageTextDiff(string, string, разпознаванеSettings, bool, bool)

Сравнете текстовете на двете изображения и върнете число, което представлява колко са подобни (0 до 1).

public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)

Parameters

fullPath1 string

Пътят към първата картина.

fullPath2 string

Пътят към втората картина.

settings RecognitionSettings

Настройки за разпознаване.

ignoreCase bool

Истински - означава случайно нечувствително търсене.

autoSkew bool

Осигурява автоматична корекция на изображението.

Returns

float

0 означава, че текстовете са напълно различни; 1.

Recognize(OcrInput)

Разпознава текста върху изображения / документи.GIF, PNG, JPEG, BMP, TIFF, JFIF.

public OcrOutput Recognize(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

OcrOutput

Aspose.OCR.Recognition.

Recognize(OcrInput, RecognitionSettings, CancellationToken)

Разпознава текста върху изображения / документи.GIF, PNG, JPEG, BMP, TIFF, JFIF.

public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

settings RecognitionSettings

Aspose.OCR.RecognitionSettings.

cancellationToken CancellationToken

Изтегляне на обекта.

Returns

OcrOutput

Aspose.OCR.Recognition.

Recognize(OcrInput, разпознаванеНастройки)

Разпознава текста върху изображения / документи.GIF, PNG, JPEG, BMP, TIFF, JFIF.

public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

settings RecognitionSettings

Aspose.OCR.RecognitionSettings.

Returns

OcrOutput

Aspose.OCR.Recognition.

RecognizeCarPlate(OcrInput)

Разпознава текста на автомобилната плоча.

public OcrOutput RecognizeCarPlate(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

Aspose.OCR.CarPlateRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

RecognizeCarPlate(OcrInput, CarPlateRecognitionНастройки)

Разпознава текста на автомобилната плоча.

public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

settings CarPlateRecognitionSettings

Aspose.OCR.CarPlateRecognitionSettings.

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

Aspose.OCR.CarPlateRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

RecognizeCharacters(OcrInput)

Открива символи на изображенията.GIF, PNG, JPEG, BMP, TIFF, JFIF.

public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

List < CharacterRecognitionResult >

Aspose.OCR.CharacterRecognition.

RecognizeCharacters(OcrInput, DetectAreasMode, Език)

Открива символи на изображенията.GIF, PNG, JPEG, BMP, TIFF, JFIF.

public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

detectAreasMode DetectAreasMode

Определя вида на невронната мрежа, използвана за откриване на зони.

language Language

Езикът, използван за OCR.

Returns

List < CharacterRecognitionResult >

Списък на Aspose.OCR.Чакт с данни за открити символи.

RecognizeFast(OcrInput)

Разпознава текста върху изображения / документи.GIF, PNG, JPEG, BMP, TIFF, JFIF.

public List<string> RecognizeFast(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

List < string >

Списък на редове с резултати за разпознаване на изображението.

RecognizeHandwrittenText(OcrInput)

Разпознава ръчно написания текст върху изображенията.

public OcrOutput RecognizeHandwrittenText(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

GIF, PNG, JPEG, BMP, TIFF, JFIF.

Идентифициране на IDCard(OcrInput)

Идентифицира текст на идентификационна карта.

public OcrOutput RecognizeIDCard(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

Aspose.OCR.IDCardRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

Идентифициране на IDCard(OcrInput, IDCardRecognitionНастройки)

Идентифицира текст на идентификационна карта.

public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

settings IDCardRecognitionSettings

Aspose.OCR.IDCardRecognitionSettings.

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

Aspose.OCR.IDCardRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

RecognizeInvoice(OcrInput)

Препоръчва се текст на фактурата.

public OcrOutput RecognizeInvoice(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

Aspose.OCR.InvoiceRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

RecognizeInvoice(OcrInput, InvoiceRecognitionНастройки)

Препоръчва се текст на фактурата.

public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

settings InvoiceRecognitionSettings

Aspose.OCR.InvoiceRecognitionSettings.

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

Aspose.OCR.InvoiceRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.GIF, PNG, JPEG, BMP, TIFF, JFIF.

RecognizeLines(OcrInput)

Разпознава изображения, които съдържат един ред на текст.GIF, PNG, JPEG, BMP, TIFF, JFIF.

public OcrOutput RecognizeLines(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

OcrOutput

Aspose.OCR.Recognition.

RecognizeLines(OcrInput, разпознаванеНастройки)

Разпознава изображения, които съдържат един ред на текст.GIF, PNG, JPEG, BMP, TIFF, JFIF.

public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

settings RecognitionSettings

Aspose.OCR.RecognitionSettings.

Returns

OcrOutput

Aspose.OCR.Recognition.

RecognizePassport(OcrInput)

Препоръчва се текстът на паспорта.

public OcrOutput RecognizePassport(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

Aspose.OCR.PassportRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

RecognizePassport(OcrInput, PassportRecognitionНастройки)

Препоръчва се текстът на паспорта.

public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

settings PassportRecognitionSettings

Aspose.OCR.PassportRecognitionSettings.

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

Aspose.OCR.PassportRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

RecognizeReceipt(OcrInput)

Препоръчва се да се разпознава текстът на рецептите.

public OcrOutput RecognizeReceipt(OcrInput images)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

Aspose.OCR.ReceiptRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

RecognizeReceipt(OcrInput, ReceiptRecognitionНастройки)

Препоръчва се да се разпознава текстът на рецептите.

public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)

Parameters

images OcrInput

Контейнер с източници.Aspose.OCR.OcrInput

settings ReceiptRecognitionSettings

Aspose.OCR.ReceiptRecognitionSettings.

Returns

OcrOutput

Aspose.OCR.Recognition.

Remarks

Aspose.OCR.ReceiptRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.

SaveMultipageDocument(string, SaveFormat, List<recognitionрезултат>, PdfOptimizationMode)

Позволява да се получи мултистранен документ от списъка с обекти на RecognitionResult

public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Parameters

fullFileName string

Филеименование с път за спасяване на резултата в избрания формат.

saveFormat SaveFormat

Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).

results List < RecognitionResult >

Aspose.OCR.RecognitionResult.

embeddedFontPath string

Опционално. пълен път към потребителския шрифт.

optimizePdf PdfOptimizationMode

Намалете размера на PDF файла, като намалите качеството на фонови изображения. по подразбиране, първоначалното качество на изображението се запазва.

SaveMultipageDocument(string, SaveFormat, List<recognitionрезултат>, Bool, SpellCheckLanguage, string, string, PdfOptimizationMode)

Позволява да се получи мултистранен документ от списъка с обекти на RecognitionResult

public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Parameters

fullFileName string

Филеименование с път за спасяване на резултата в избрания формат.

saveFormat SaveFormat

Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).

results List < RecognitionResult >

Aspose.OCR.RecognitionResult.

applySpellingCorrection bool

Поставете вярно да коригирате погрешни думи, ако имате такива в резултата за разпознаване.

language SpellCheckLanguage

Речник за спил проверка (опционално).

dictionaryPath string

Пълният път към речника на потребителя в .txt формат. Форматът е [слово - пространство - честота(номер)].Пример: 23135851162\nthat 3400031103\n

embeddedFontPath string

Опционално. пълен път към потребителския шрифт.

optimizePdf PdfOptimizationMode

Намалете размера на PDF файла, като намалите качеството на фонови изображения. по подразбиране, първоначалното качество на изображението се запазва.

SaveMultipageDocument(MemoryStream, SaveFormat, Списък<Резултат за разпознаване>, PdfOptimizationMode)

Позволява да се получи мултистранен документ от списъка с обекти на RecognitionResult

public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Parameters

stream MemoryStream

MemoryStream за спестяване на разпознаване се получава в избрания формат.

saveFormat SaveFormat

Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).

results List < RecognitionResult >

Aspose.OCR.RecognitionResult.

embeddedFontPath string

Опционално. пълен път към потребителския шрифт.

optimizePdf PdfOptimizationMode

Намалете размера на PDF файла, като намалите качеството на фонови изображения. по подразбиране, първоначалното качество на изображението се запазва.

SaveMultipageDocument(MemoryStream, SaveFormat, Списък<Резултат за разпознаване>, Bool, SpellCheckLanguage, string, string, PdfOptimizationMode)

Позволява да се получи мултистранен документ от списъка с обекти на RecognitionResult

public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Parameters

stream MemoryStream

MemoryStream за спестяване на разпознаване се получава в избрания формат.

saveFormat SaveFormat

Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).

results List < RecognitionResult >

Aspose.OCR.RecognitionResult.

applySpellingCorrection bool

Поставете вярно да коригирате погрешни думи, ако имате такива в резултата за разпознаване.

language SpellCheckLanguage

Речник за спил проверка (опционално).

dictionaryPath string

Пълният път към речника на потребителя в .txt формат. Форматът е [слово - пространство - честота(номер)].Пример: 23135851162\nthat 3400031103\n

embeddedFontPath string

Опционално. пълен път към потребителския шрифт.

optimizePdf PdfOptimizationMode

Намалете размера на PDF файла, като намалите качеството на фонови изображения. по подразбиране, първоначалното качество на изображението се запазва.

OcrProgress

Събитие за проследяване на напредъка на мулти-страничното изображение.

public event OcrRecognizeEventHandler OcrProgress

Тип на събитие

OcrRecognizeEventHandler

 Български