Class AsposeOcr
Navne til: Aspose.OCR Sammensætning: Aspose.OCR.dll (25.5.0)
Den vigtigste API for Aspose OCR-bibliotek
public class AsposeOcr : IDisposableInheritance
Implements
De arvede medlemmer
object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()
Constructors
AsposeOcr()
public AsposeOcr()Methods
CalculateSkew(OcrInput)
Beregner de skive hjørner af et billede.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public List<skewoutput> CalculateSkew(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
List < SkewOutput >
Liste over skive hjørner i grader Aspose.OCR.SkewOutput.
CompareImageTexts(String, String, RecognitionSettings, Bool)
Kontrollér, om to billeder indeholder samme tekst.
public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)Parameters
fullPath1 string
Vejen til det første billede.
fullPath2 string
Vejen til det andet billede.
settings RecognitionSettings
anerkendelse af indstillingerne.
ignoreCase bool
Sannelig - betyder en case-insensitive søgning.
Returns
Det er sandt, hvis billederne har samme tekst (90% lignende).
CorrectSpelling(String, SpellCheckLanguage og String)
Korrigere tekst (erstatter forkert ord).
public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)Parameters
text string
Tekst til korrigering.
language SpellCheckLanguage
Dictionary til brug.
dictionaryPath string
Fuld vej til brugerordboken (frekvensordbok).Ordbog filformat:Fjern tekstfil i UTF-8 kodning.Ord og ordfrekvens er adskilt af rum eller tab.For standard forventes ordet i den første kolonne og frekvensen i den anden kolonne.Hver ord-frekvens-par i en adskilt linje.A linje defineres som en sekvens af tegn efterfulgt af en linje feed ("\n"), en transport retur ("\r"),eller en transport retur med det samme efterfulgt af en linje feed ("\r\n").Hvert ord forventes at være i lavere tilfælde.
Returns
Tekst med udskiftede ord.
DetectDefects(OcrInput og DefectType)
Automatisk finde problematiske områder af et billede, der kan påvirke OCR’s nøjagtighed betydeligt.Understøtter PNG, JPEG, BMP, TIFF, JFIF og GIF-billeder, der leveres som en fil, strøm eller pixel array.
public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)Parameters
images OcrInput
Kildebilleder Aspose.OCR.OcrInput
defectType DefectType
De typer af defekter, der skal anerkendes Aspose.OCR.DefectType
Returns
List < DefectOutput >
Detekteret billeddefekter eller ab tom samling, hvis der ikke er fundet defekter Aspose.OCR.DefectOutput.
DetectDocumentLayout(OcrInput)
Analyserer billedet og identificerer de forskellige typer af indholdsområder inden for det.Understøtter PNG, JPEG, BMP, TIFF, JFIF og GIF-billeder fra filer, strømme og pixels.
public List<layoutoutput> DetectDocumentLayout(OcrInput images)Parameters
images OcrInput
Kilde billeder.Aspose.OCR.OcrInput
Returns
List < LayoutOutput >
Detekterede indholdsområder, Aspose.OCR.LayoutOutput.
DetectLanguages(OcrInput)
Analyserer teksten på billedet for at bestemme de sprog, det er skrevet i.Dette giver dig mulighed for at vælge det mest egnede anerkendelsessprog og hjælper med yderligere tekstbehandling opgaver som spellchecking eller oversættelse.
public List<languagedetectionoutput> DetectLanguages(OcrInput images)Parameters
images OcrInput
Kildebilleder Aspose.OCR.OcrInput
Returns
List < LanguageDetectionOutput >
Returnerer en liste over de mest sandsynlige sprog, rangeret af sandsynlighed Aspose.OCR.LanguageDetectionOutput.
DetectRectangles(OcrInput)
Detekterer tekstområder på billeder.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
[Obsolete("Will be removed in the release 25.8.0")]
public List<rectangleoutput> DetectRectangles(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
List < RectangleOutput >
Liste over Aspose.OCR.RectangleOutput med detekterede tekstområder eller linjer.
DetectRectangles(OcrInput, AreasType, Bool)
Detekterer tekstområder på billeder.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
areasType AreasType
Det bestemmer vik rektangler til at returnere - linje eller afsnit.
detectAreas bool
Det giver mulighed for automatisk tekstområderdetektion.
Returns
List < RectangleOutput >
Liste over Aspose.OCR.RectangleOutput med detekterede tekstområder eller linjer.
Dispose()
klare ressourcer til anerkendelse.
public void Dispose()ImageHasText(string, string, RecognitionSettings, bool, bool)
Kontrollér, om billedet indeholder den leverede tekst fragment.
public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)Parameters
fullPath string
Vejen til billedet.
text string
Tekst fragment til søgning på billedet.
settings RecognitionSettings
anerkendelse af indstillingerne.
ignoreCase bool
Sannelig - betyder en case-insensitive søgning.
autoSkew bool
Det giver mulighed for automatisk billedskifte korrigering.
Returns
Det er sandt, hvis billedet indeholder tekstfragmenter. falsk - billedet indeholder ikke tekstfragmenter.
Remarks
Det anerkender billedet med evnen til at angive Aspose.OCR.RecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageHasText(String, Regex, RecognitionSettings, Bool)
Kontrollér, om billedteksten er i overensstemmelse med den givne almindelige udtryk.
public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)Parameters
fullPath string
Vejen til billedet.
regex Regex
System.Text.RegularExpressions objekter med de foreslåede mønstre og muligheder.
settings RecognitionSettings
anerkendelse af indstillingerne.
autoSkew bool
Det giver mulighed for automatisk billedskifte korrigering.
Returns
Det er sandt, hvis billedteksten svarer til den ordinarie udtryk, der er givet.
Remarks
Det anerkender billedet med evnen til at angive Aspose.OCR.RecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageTextDiff(string, string, RecognitionSettings, bool, bool)
Sammenlign tekstene på de to billeder og giv et tal, der repræsenterer, hvor lignende de er (0 til 1).
public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)Parameters
fullPath1 string
Vejen til det første billede.
fullPath2 string
Vejen til det andet billede.
settings RecognitionSettings
anerkendelse af indstillingerne.
ignoreCase bool
Sannelig - betyder en case-insensitive søgning.
autoSkew bool
Det giver mulighed for automatisk billedskifte korrigering.
Returns
0 betyder, at teksten er helt anderledes; 1 betyder, at teksten er identiske.
Recognize(OcrInput)
Anerkender tekst på billeder / dokumenter.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
public OcrOutput Recognize(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Recognize(OcrInput, RecognitionSettings, CancellationToken)
Anerkender tekst på billeder / dokumenter.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings RecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.RecognitionSettings.
cancellationToken CancellationToken
Cancellation af objektet.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Recognize(OcrInput og RecognitionSettings)
Anerkender tekst på billeder / dokumenter.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings RecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.RecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
RecognizeCarPlate(OcrInput)
Læs tekst på bilpladen.
public OcrOutput RecognizeCarPlate(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Det genkender bilplader med evnen til at angive Aspose.OCR.CarPlateRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeCarPlate(OcrInput og CarPlateRecognition)
Læs tekst på bilpladen.
public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings CarPlateRecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.CarPlateRecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Det genkender bilplader med evnen til at angive Aspose.OCR.CarPlateRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeCharacters(OcrInput)
Detekterer symboler på billederne.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
List < CharacterRecognitionResult >
Fortegnelse af Aspose.OCR.CharacterRecognitionResultat med detekterede symboler data.
RecognizeCharacters(OcrInput, DetectAreasMode, Sprog)
Detekterer symboler på billederne.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
detectAreasMode DetectAreasMode
Det bestemmer typen af neurale netværk, der anvendes til opdagelse af områder.
language Language
Sproget bruges til OCR..
Returns
List < CharacterRecognitionResult >
Liste af Aspose.OCR.Charakter med detekterede symboler data.
RecognizeFast(OcrInput)
Anerkender tekst på billeder / dokumenter.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
public List<string> RecognizeFast(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over linjer med billedoptagelsesresultater.
RecognizeHandwrittenText(OcrInput)
Identificerer håndskrevet tekst på billederne.
public OcrOutput RecognizeHandwrittenText(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
Identifikationskort(OcrInput)
Identifikation af tekst på ID-kortet.
public OcrOutput RecognizeIDCard(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Det genkender ID-kort med evnen til at angive Aspose.OCR.IDCardRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
Identifikationskort(OcrInput og IDCardRecognition)
Identifikation af tekst på ID-kortet.
public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings IDCardRecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.IDCardRecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Det genkender ID-kort med evnen til at angive Aspose.OCR.IDCardRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeInvoice(OcrInput)
Læs tekst på fakturaer.
public OcrOutput RecognizeInvoice(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Anerkender fakturaer med evnen til at angive Aspose.OCR.InvoiceRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
Læs tekst på fakturaer.
public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings InvoiceRecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.InvoiceRecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Anerkender fakturaer med evnen til at angive Aspose.OCR.InvoiceRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeLines(OcrInput)
Det genkender billeder, der indeholder en enkelt tekstlinje.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public OcrOutput RecognizeLines(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
RecognizeLines(OcrInput og RecognitionSettings)
Det genkender billeder, der indeholder en enkelt tekstlinje.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings RecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.RecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
RecognizePassport(OcrInput)
Læs tekst på pas.
public OcrOutput RecognizePassport(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Identificerer pass med evnen til at angive Aspose.OCR.PassportRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizePassport(OcrInput og PassportRecognition)
Læs tekst på pas.
public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings PassportRecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.PassportRecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Identificerer pass med evnen til at angive Aspose.OCR.PassportRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeReceipt(OcrInput)
Læs tekst på modtagelser.
public OcrOutput RecognizeReceipt(OcrInput images)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Anerkender fakturaer med evnen til at angive Aspose.OCR.ReceiptRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeReceipt(OcrInput, ReceiptRecognitionSettings)
Læs tekst på modtagelser.
public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)Parameters
images OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings ReceiptRecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.ReceiptRecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Anerkender fakturaer med evnen til at angive Aspose.OCR.ReceiptRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
SaveMultipageDocument(string, SaveFormat, List, String, PdfOptimizationMode)
Tillader at få flere sider dokument fra listen over RecognitionResult-objekter
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)Parameters
fullFileName string
Filnavn med en vej til at redde genkendelse resulterer i det valgte format.
saveFormat SaveFormat
Dokumentformat (Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results List
<
RecognitionResult
>
Liste over Aspose.OCR.RecognitionResult objekter.
embeddedFontPath string
Optionelt. fuld vej til brugeren font.
optimizePdf PdfOptimizationMode
Reduktion af PDF-filstørrelsen ved at nedsætte kvaliteten af baggrundsbilleder.
SaveMultipageDocument(string, SaveFormat, List, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Tillader at få flere sider dokument fra listen over RecognitionResult-objekter
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)Parameters
fullFileName string
Filnavn med en vej til at redde genkendelse resulterer i det valgte format.
saveFormat SaveFormat
Dokumentformat (Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results List
<
RecognitionResult
>
Liste over Aspose.OCR.RecognitionResult objekter.
applySpellingCorrection bool
Sæt troværdig til at korrigere forfalskede ord, hvis du har sådan i din anerkendelsesresultat.
language SpellCheckLanguage
Ordet for spell check (valglig).
dictionaryPath string
Optionelt. fuld vej til brugerordboken i .txt format. formatet er [ord - rum - frekvens(nummer)].Eksempel: 23135851162\nthat 3400031103\n
embeddedFontPath string
Optionelt. fuld vej til brugeren font.
optimizePdf PdfOptimizationMode
Reduktion af PDF-filstørrelsen ved at nedsætte kvaliteten af baggrundsbilleder.
SaveMultipageDocument(MemoryStream, SaveFormat, Liste, String, PdfOptimizationMode)
Tillader at få flere sider dokument fra listen over RecognitionResult-objekter
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)Parameters
stream MemoryStream
MemoryStream for at redde genkendelse resulterer i det valgte format.
saveFormat SaveFormat
Dokumentformat (Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results List
<
RecognitionResult
>
Liste over Aspose.OCR.RecognitionResult objekter.
embeddedFontPath string
Optionelt. fuld vej til brugeren font.
optimizePdf PdfOptimizationMode
Reduktion af PDF-filstørrelsen ved at nedsætte kvaliteten af baggrundsbilleder.
SaveMultipageDocument(MemoryStream, SaveFormat, Liste, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Tillader at få flere sider dokument fra listen over RecognitionResult-objekter
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)Parameters
stream MemoryStream
MemoryStream for at redde genkendelse resulterer i det valgte format.
saveFormat SaveFormat
Dokumentformat (Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results List
<
RecognitionResult
>
Liste over Aspose.OCR.RecognitionResult objekter.
applySpellingCorrection bool
Sæt troværdig til at korrigere forfalskede ord, hvis du har sådan i din anerkendelsesresultat.
language SpellCheckLanguage
Ordet for spell check (valglig).
dictionaryPath string
Optionelt. fuld vej til brugerordboken i .txt format. formatet er [ord - rum - frekvens(nummer)].Eksempel: 23135851162\nthat 3400031103\n
embeddedFontPath string
Optionelt. fuld vej til brugeren font.
optimizePdf PdfOptimizationMode
Reduktion af PDF-filstørrelsen ved at nedsætte kvaliteten af baggrundsbilleder.
OcrProgress
En begivenhed til at spore fremskridt i multi-page image recognition.
public event OcrRecognizeEventHandler OcrProgress