Class AsposeOcr
Името на пространството: Aspose.OCR Асамблея: Aspose.OCR.dll (25.4.0)
Основна API за ASPOSE OCR библиотека
public class AsposeOcr : IDisposable
Inheritance
Implements
наследници
object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()
Constructors
AsposeOcr()
public AsposeOcr()
Methods
CalculateSkew(OcrInput)
Изчислява ъглите на изображението.GIF, PNG, JPEG, BMP, TIFF, JFIF.
public List<skewoutput> CalculateSkew(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
List < SkewOutput >
Aspose.OCR.SkewOutput.
CompareImageTexts(string, string, разпознаванеSettings, bool)
Проверете дали две изображения съдържат един и същ текст.
public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)
Parameters
fullPath1
string
Пътят към първата картина.
fullPath2
string
Пътят към втората картина.
settings
RecognitionSettings
Настройки за разпознаване.
ignoreCase
bool
Истински - означава случайно нечувствително търсене.
Returns
Вярно е, ако изображенията имат същия текст (90% сходство).
CorrectSpelling(Стринг, SpellCheckLanguage, Стринг)
Правилният текст (заменя неправилните думи).
public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)
Parameters
text
string
Текст за корекция.
language
SpellCheckLanguage
Речник за използване.
dictionaryPath
string
Пълният път към речника на потребителя (речник на честотата).Файл формат на речник:Пълно текстови файлове в UTF-8 кодиране.По подразбиране, думата се очаква в първата колона и честотата в втората.Всяка дума-честотна двойка в отделна линия.Линкът е дефиниран като последователност от знаци, следвана от линията ("\n"), връщането на превозното средство („\r"),или връщане на превоз незабавно, следвано от линия ("\r\n").Всяка дума се очаква да бъде в по-ниски случаи.
Returns
Текст с замествани думи.
DetectDefects(Оригинално име: DefectType)
Автоматично намиране на проблематични области на изображението, които могат значително да повлияят на точността на OCR.Поддържа PNG, JPEG, BMP, TIFF, JFIF и GIF изображения, предоставени като файл, поток или пикселен диапазон.
public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)
Parameters
images
OcrInput
Източник на изображения Aspose.OCR.OcrInput
defectType
DefectType
Видове дефекти, които трябва да бъдат разпознати Aspose.OCR.DefectType
Returns
List < DefectOutput >
Открити дефекти на изображението или аб празна колекция, ако не е намерена грешка Aspose.OCR.DefectOutput.
DetectDocumentLayout(OcrInput)
Анализира изображението и идентифицира различните видове области на съдържанието в него.Поддържа PNG, JPEG, BMP, TIFF, JFIF и GIF изображения от файлове, потоци и пикселни рамки.
public List<layoutoutput> DetectDocumentLayout(OcrInput images)
Parameters
images
OcrInput
Източник на изображения.Aspose.OCR.OcrInput
Returns
List < LayoutOutput >
Aspose.OCR.LayoutOutput.
DetectLanguages(OcrInput)
Анализира текста на изображението, за да определи езиците, в които е написано.Това ви позволява да изберете най-подходящия език за разпознаване и помага при по-нататъшни задачи за обработка на текст, като например spellchecking или превод.
public List<languagedetectionoutput> DetectLanguages(OcrInput images)
Parameters
images
OcrInput
Източник на изображения Aspose.OCR.OcrInput
Returns
List < LanguageDetectionOutput >
Aspose.OCR.LanguageDetectionOutput.
DetectRectangles(OcrInput)
Открива текстови области на изображенията.GIF, PNG, JPEG, BMP, TIFF, JFIF.
[Obsolete("Will be removed in the release 25.8.0")]
public List<rectangleoutput> DetectRectangles(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
List < RectangleOutput >
Aspose.OCR.RectangleOutput.
DetectRectangles(Оригинално име: AreasType, Bool)
Открива текстови области на изображенията.GIF, PNG, JPEG, BMP, TIFF, JFIF.
public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
areasType
AreasType
Определя въртящи се правоъгълници - линия или параграфи.
detectAreas
bool
Възможност за автоматично откриване на текстови области.
Returns
List < RectangleOutput >
Aspose.OCR.RectangleOutput.
Dispose()
Определени ресурси за признаване.
public void Dispose()
ImageHasText(string, string, разпознаванеSettings, bool, bool)
Проверете дали изображението съдържа предоставения текст фрагмент.
public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Parameters
fullPath
string
Пътят към изображението.
text
string
Текст фрагмент за търсене на изображението.
settings
RecognitionSettings
Настройки за разпознаване.
ignoreCase
bool
Истински - означава случайно нечувствително търсене.
autoSkew
bool
Осигурява автоматична корекция на изображението.
Returns
Вярно е, ако изображението съдържа фрагмент от текст. Фалшива - снимката не съдържа текстови части.
Remarks
Aspose.OCR.RecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageHasText(String, Regex, Настройки за разпознаване, Bool)
Проверете дали текстът на изображението съответства на предоставения редовен израз.
public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)
Parameters
fullPath
string
Пътят към изображението.
regex
Regex
System.Text.RegularExpressions.
settings
RecognitionSettings
Настройки за разпознаване.
autoSkew
bool
Осигурява автоматична корекция на изображението.
Returns
Вярно е, ако текстът на изображението съответства на предоставения редовен израз.
Remarks
Aspose.OCR.RecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageTextDiff(string, string, разпознаванеSettings, bool, bool)
Сравнете текстовете на двете изображения и върнете число, което представлява колко са подобни (0 до 1).
public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Parameters
fullPath1
string
Пътят към първата картина.
fullPath2
string
Пътят към втората картина.
settings
RecognitionSettings
Настройки за разпознаване.
ignoreCase
bool
Истински - означава случайно нечувствително търсене.
autoSkew
bool
Осигурява автоматична корекция на изображението.
Returns
0 означава, че текстовете са напълно различни; 1.
Recognize(OcrInput)
Разпознава текста върху изображения / документи.GIF, PNG, JPEG, BMP, TIFF, JFIF.
public OcrOutput Recognize(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
Aspose.OCR.Recognition.
Recognize(OcrInput, RecognitionSettings, CancellationToken)
Разпознава текста върху изображения / документи.GIF, PNG, JPEG, BMP, TIFF, JFIF.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
settings
RecognitionSettings
Aspose.OCR.RecognitionSettings.
cancellationToken
CancellationToken
Изтегляне на обекта.
Returns
Aspose.OCR.Recognition.
Recognize(OcrInput, разпознаванеНастройки)
Разпознава текста върху изображения / документи.GIF, PNG, JPEG, BMP, TIFF, JFIF.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
settings
RecognitionSettings
Aspose.OCR.RecognitionSettings.
Returns
Aspose.OCR.Recognition.
RecognizeCarPlate(OcrInput)
Разпознава текста на автомобилната плоча.
public OcrOutput RecognizeCarPlate(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
Aspose.OCR.Recognition.
Remarks
Aspose.OCR.CarPlateRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
RecognizeCarPlate(OcrInput, CarPlateRecognitionНастройки)
Разпознава текста на автомобилната плоча.
public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
settings
CarPlateRecognitionSettings
Aspose.OCR.CarPlateRecognitionSettings.
Returns
Aspose.OCR.Recognition.
Remarks
Aspose.OCR.CarPlateRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
RecognizeCharacters(OcrInput)
Открива символи на изображенията.GIF, PNG, JPEG, BMP, TIFF, JFIF.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
List < CharacterRecognitionResult >
Aspose.OCR.CharacterRecognition.
RecognizeCharacters(OcrInput, DetectAreasMode, Език)
Открива символи на изображенията.GIF, PNG, JPEG, BMP, TIFF, JFIF.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
detectAreasMode
DetectAreasMode
Определя вида на невронната мрежа, използвана за откриване на зони.
language
Language
Езикът, използван за OCR.
Returns
List < CharacterRecognitionResult >
Списък на Aspose.OCR.Чакт с данни за открити символи.
RecognizeFast(OcrInput)
Разпознава текста върху изображения / документи.GIF, PNG, JPEG, BMP, TIFF, JFIF.
public List<string> RecognizeFast(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
Списък на редове с резултати за разпознаване на изображението.
RecognizeHandwrittenText(OcrInput)
Разпознава ръчно написания текст върху изображенията.
public OcrOutput RecognizeHandwrittenText(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
Aspose.OCR.Recognition.
Remarks
GIF, PNG, JPEG, BMP, TIFF, JFIF.
Идентифициране на IDCard(OcrInput)
Идентифицира текст на идентификационна карта.
public OcrOutput RecognizeIDCard(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
Aspose.OCR.Recognition.
Remarks
Aspose.OCR.IDCardRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
Идентифициране на IDCard(OcrInput, IDCardRecognitionНастройки)
Идентифицира текст на идентификационна карта.
public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
settings
IDCardRecognitionSettings
Aspose.OCR.IDCardRecognitionSettings.
Returns
Aspose.OCR.Recognition.
Remarks
Aspose.OCR.IDCardRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
RecognizeInvoice(OcrInput)
Препоръчва се текст на фактурата.
public OcrOutput RecognizeInvoice(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
Aspose.OCR.Recognition.
Remarks
Aspose.OCR.InvoiceRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
RecognizeInvoice(OcrInput, InvoiceRecognitionНастройки)
Препоръчва се текст на фактурата.
public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
settings
InvoiceRecognitionSettings
Aspose.OCR.InvoiceRecognitionSettings.
Returns
Aspose.OCR.Recognition.
Remarks
Aspose.OCR.InvoiceRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.GIF, PNG, JPEG, BMP, TIFF, JFIF.
RecognizeLines(OcrInput)
Разпознава изображения, които съдържат един ред на текст.GIF, PNG, JPEG, BMP, TIFF, JFIF.
public OcrOutput RecognizeLines(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
Aspose.OCR.Recognition.
RecognizeLines(OcrInput, разпознаванеНастройки)
Разпознава изображения, които съдържат един ред на текст.GIF, PNG, JPEG, BMP, TIFF, JFIF.
public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
settings
RecognitionSettings
Aspose.OCR.RecognitionSettings.
Returns
Aspose.OCR.Recognition.
RecognizePassport(OcrInput)
Препоръчва се текстът на паспорта.
public OcrOutput RecognizePassport(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
Aspose.OCR.Recognition.
Remarks
Aspose.OCR.PassportRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
RecognizePassport(OcrInput, PassportRecognitionНастройки)
Препоръчва се текстът на паспорта.
public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
settings
PassportRecognitionSettings
Aspose.OCR.PassportRecognitionSettings.
Returns
Aspose.OCR.Recognition.
Remarks
Aspose.OCR.PassportRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
RecognizeReceipt(OcrInput)
Препоръчва се да се разпознава текстът на рецептите.
public OcrOutput RecognizeReceipt(OcrInput images)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
Returns
Aspose.OCR.Recognition.
Remarks
Aspose.OCR.ReceiptRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
RecognizeReceipt(OcrInput, ReceiptRecognitionНастройки)
Препоръчва се да се разпознава текстът на рецептите.
public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)
Parameters
images
OcrInput
Контейнер с източници.Aspose.OCR.OcrInput
settings
ReceiptRecognitionSettings
Aspose.OCR.ReceiptRecognitionSettings.
Returns
Aspose.OCR.Recognition.
Remarks
Aspose.OCR.ReceiptRecognitionSettings.GIF, PNG, JPEG, BMP, TIFF, JFIF.
SaveMultipageDocument(string, SaveFormat, List<recognitionрезултат>, PdfOptimizationMode)
Позволява да се получи мултистранен документ от списъка с обекти на RecognitionResult
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
fullFileName
string
Филеименование с път за спасяване на резултата в избрания формат.
saveFormat
SaveFormat
Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results
List
<
RecognitionResult
>
Aspose.OCR.RecognitionResult.
embeddedFontPath
string
Опционално. пълен път към потребителския шрифт.
optimizePdf
PdfOptimizationMode
Намалете размера на PDF файла, като намалите качеството на фонови изображения. по подразбиране, първоначалното качество на изображението се запазва.
SaveMultipageDocument(string, SaveFormat, List<recognitionрезултат>, Bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Позволява да се получи мултистранен документ от списъка с обекти на RecognitionResult
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
fullFileName
string
Филеименование с път за спасяване на резултата в избрания формат.
saveFormat
SaveFormat
Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results
List
<
RecognitionResult
>
Aspose.OCR.RecognitionResult.
applySpellingCorrection
bool
Поставете вярно да коригирате погрешни думи, ако имате такива в резултата за разпознаване.
language
SpellCheckLanguage
Речник за спил проверка (опционално).
dictionaryPath
string
Пълният път към речника на потребителя в .txt формат. Форматът е [слово - пространство - честота(номер)].Пример: 23135851162\nthat 3400031103\n
embeddedFontPath
string
Опционално. пълен път към потребителския шрифт.
optimizePdf
PdfOptimizationMode
Намалете размера на PDF файла, като намалите качеството на фонови изображения. по подразбиране, първоначалното качество на изображението се запазва.
SaveMultipageDocument(MemoryStream, SaveFormat, Списък<Резултат за разпознаване>, PdfOptimizationMode)
Позволява да се получи мултистранен документ от списъка с обекти на RecognitionResult
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
stream
MemoryStream
MemoryStream за спестяване на разпознаване се получава в избрания формат.
saveFormat
SaveFormat
Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results
List
<
RecognitionResult
>
Aspose.OCR.RecognitionResult.
embeddedFontPath
string
Опционално. пълен път към потребителския шрифт.
optimizePdf
PdfOptimizationMode
Намалете размера на PDF файла, като намалите качеството на фонови изображения. по подразбиране, първоначалното качество на изображението се запазва.
SaveMultipageDocument(MemoryStream, SaveFormat, Списък<Резултат за разпознаване>, Bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Позволява да се получи мултистранен документ от списъка с обекти на RecognitionResult
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
stream
MemoryStream
MemoryStream за спестяване на разпознаване се получава в избрания формат.
saveFormat
SaveFormat
Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results
List
<
RecognitionResult
>
Aspose.OCR.RecognitionResult.
applySpellingCorrection
bool
Поставете вярно да коригирате погрешни думи, ако имате такива в резултата за разпознаване.
language
SpellCheckLanguage
Речник за спил проверка (опционално).
dictionaryPath
string
Пълният път към речника на потребителя в .txt формат. Форматът е [слово - пространство - честота(номер)].Пример: 23135851162\nthat 3400031103\n
embeddedFontPath
string
Опционално. пълен път към потребителския шрифт.
optimizePdf
PdfOptimizationMode
Намалете размера на PDF файла, като намалите качеството на фонови изображения. по подразбиране, първоначалното качество на изображението се запазва.
OcrProgress
Събитие за проследяване на напредъка на мулти-страничното изображение.
public event OcrRecognizeEventHandler OcrProgress