Class AsposeOcr
Navne til: Aspose.OCR Sammensætning: Aspose.OCR.dll (25.4.0)
Den vigtigste API for Aspose OCR-bibliotek
public class AsposeOcr : IDisposable
Inheritance
Implements
De arvede medlemmer
object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()
Constructors
AsposeOcr()
public AsposeOcr()
Methods
CalculateSkew(OcrInput)
Beregner de skive hjørner af et billede.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public List<skewoutput> CalculateSkew(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
List < SkewOutput >
Liste over skive hjørner i grader Aspose.OCR.SkewOutput.
CompareImageTexts(String, String, RecognitionSettings, Bool)
Kontrollér, om to billeder indeholder samme tekst.
public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)
Parameters
fullPath1
string
Vejen til det første billede.
fullPath2
string
Vejen til det andet billede.
settings
RecognitionSettings
anerkendelse af indstillingerne.
ignoreCase
bool
Sannelig - betyder en case-insensitive søgning.
Returns
Det er sandt, hvis billederne har samme tekst (90% lignende).
CorrectSpelling(String, SpellCheckLanguage og String)
Korrigere tekst (erstatter forkert ord).
public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)
Parameters
text
string
Tekst til korrigering.
language
SpellCheckLanguage
Dictionary til brug.
dictionaryPath
string
Fuld vej til brugerordboken (frekvensordbok).Ordbog filformat:Fjern tekstfil i UTF-8 kodning.Ord og ordfrekvens er adskilt af rum eller tab.For standard forventes ordet i den første kolonne og frekvensen i den anden kolonne.Hver ord-frekvens-par i en adskilt linje.A linje defineres som en sekvens af tegn efterfulgt af en linje feed ("\n"), en transport retur ("\r"),eller en transport retur med det samme efterfulgt af en linje feed ("\r\n").Hvert ord forventes at være i lavere tilfælde.
Returns
Tekst med udskiftede ord.
DetectDefects(OcrInput og DefectType)
Automatisk finde problematiske områder af et billede, der kan påvirke OCR’s nøjagtighed betydeligt.Understøtter PNG, JPEG, BMP, TIFF, JFIF og GIF-billeder, der leveres som en fil, strøm eller pixel array.
public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)
Parameters
images
OcrInput
Kildebilleder Aspose.OCR.OcrInput
defectType
DefectType
De typer af defekter, der skal anerkendes Aspose.OCR.DefectType
Returns
List < DefectOutput >
Detekteret billeddefekter eller ab tom samling, hvis der ikke er fundet defekter Aspose.OCR.DefectOutput.
DetectDocumentLayout(OcrInput)
Analyserer billedet og identificerer de forskellige typer af indholdsområder inden for det.Understøtter PNG, JPEG, BMP, TIFF, JFIF og GIF-billeder fra filer, strømme og pixels.
public List<layoutoutput> DetectDocumentLayout(OcrInput images)
Parameters
images
OcrInput
Kilde billeder.Aspose.OCR.OcrInput
Returns
List < LayoutOutput >
Detekterede indholdsområder, Aspose.OCR.LayoutOutput.
DetectLanguages(OcrInput)
Analyserer teksten på billedet for at bestemme de sprog, det er skrevet i.Dette giver dig mulighed for at vælge det mest egnede anerkendelsessprog og hjælper med yderligere tekstbehandling opgaver som spellchecking eller oversættelse.
public List<languagedetectionoutput> DetectLanguages(OcrInput images)
Parameters
images
OcrInput
Kildebilleder Aspose.OCR.OcrInput
Returns
List < LanguageDetectionOutput >
Returnerer en liste over de mest sandsynlige sprog, rangeret af sandsynlighed Aspose.OCR.LanguageDetectionOutput.
DetectRectangles(OcrInput)
Detekterer tekstområder på billeder.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
[Obsolete("Will be removed in the release 25.8.0")]
public List<rectangleoutput> DetectRectangles(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
List < RectangleOutput >
Liste over Aspose.OCR.RectangleOutput med detekterede tekstområder eller linjer.
DetectRectangles(OcrInput, AreasType, Bool)
Detekterer tekstområder på billeder.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
areasType
AreasType
Det bestemmer vik rektangler til at returnere - linje eller afsnit.
detectAreas
bool
Det giver mulighed for automatisk tekstområderdetektion.
Returns
List < RectangleOutput >
Liste over Aspose.OCR.RectangleOutput med detekterede tekstområder eller linjer.
Dispose()
klare ressourcer til anerkendelse.
public void Dispose()
ImageHasText(string, string, RecognitionSettings, bool, bool)
Kontrollér, om billedet indeholder den leverede tekst fragment.
public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Parameters
fullPath
string
Vejen til billedet.
text
string
Tekst fragment til søgning på billedet.
settings
RecognitionSettings
anerkendelse af indstillingerne.
ignoreCase
bool
Sannelig - betyder en case-insensitive søgning.
autoSkew
bool
Det giver mulighed for automatisk billedskifte korrigering.
Returns
Det er sandt, hvis billedet indeholder tekstfragmenter. falsk - billedet indeholder ikke tekstfragmenter.
Remarks
Det anerkender billedet med evnen til at angive Aspose.OCR.RecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageHasText(String, Regex, RecognitionSettings, Bool)
Kontrollér, om billedteksten er i overensstemmelse med den givne almindelige udtryk.
public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)
Parameters
fullPath
string
Vejen til billedet.
regex
Regex
System.Text.RegularExpressions objekter med de foreslåede mønstre og muligheder.
settings
RecognitionSettings
anerkendelse af indstillingerne.
autoSkew
bool
Det giver mulighed for automatisk billedskifte korrigering.
Returns
Det er sandt, hvis billedteksten svarer til den ordinarie udtryk, der er givet.
Remarks
Det anerkender billedet med evnen til at angive Aspose.OCR.RecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageTextDiff(string, string, RecognitionSettings, bool, bool)
Sammenlign tekstene på de to billeder og giv et tal, der repræsenterer, hvor lignende de er (0 til 1).
public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Parameters
fullPath1
string
Vejen til det første billede.
fullPath2
string
Vejen til det andet billede.
settings
RecognitionSettings
anerkendelse af indstillingerne.
ignoreCase
bool
Sannelig - betyder en case-insensitive søgning.
autoSkew
bool
Det giver mulighed for automatisk billedskifte korrigering.
Returns
0 betyder, at teksten er helt anderledes; 1 betyder, at teksten er identiske.
Recognize(OcrInput)
Anerkender tekst på billeder / dokumenter.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
public OcrOutput Recognize(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Recognize(OcrInput, RecognitionSettings, CancellationToken)
Anerkender tekst på billeder / dokumenter.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings
RecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.RecognitionSettings.
cancellationToken
CancellationToken
Cancellation af objektet.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Recognize(OcrInput og RecognitionSettings)
Anerkender tekst på billeder / dokumenter.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings
RecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.RecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
RecognizeCarPlate(OcrInput)
Læs tekst på bilpladen.
public OcrOutput RecognizeCarPlate(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Det genkender bilplader med evnen til at angive Aspose.OCR.CarPlateRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeCarPlate(OcrInput og CarPlateRecognition)
Læs tekst på bilpladen.
public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings
CarPlateRecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.CarPlateRecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Det genkender bilplader med evnen til at angive Aspose.OCR.CarPlateRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeCharacters(OcrInput)
Detekterer symboler på billederne.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
List < CharacterRecognitionResult >
Fortegnelse af Aspose.OCR.CharacterRecognitionResultat med detekterede symboler data.
RecognizeCharacters(OcrInput, DetectAreasMode, Sprog)
Detekterer symboler på billederne.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
detectAreasMode
DetectAreasMode
Det bestemmer typen af neurale netværk, der anvendes til opdagelse af områder.
language
Language
Sproget bruges til OCR..
Returns
List < CharacterRecognitionResult >
Liste af Aspose.OCR.Charakter med detekterede symboler data.
RecognizeFast(OcrInput)
Anerkender tekst på billeder / dokumenter.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
public List<string> RecognizeFast(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over linjer med billedoptagelsesresultater.
RecognizeHandwrittenText(OcrInput)
Identificerer håndskrevet tekst på billederne.
public OcrOutput RecognizeHandwrittenText(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
Identifikationskort(OcrInput)
Identifikation af tekst på ID-kortet.
public OcrOutput RecognizeIDCard(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Det genkender ID-kort med evnen til at angive Aspose.OCR.IDCardRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
Identifikationskort(OcrInput og IDCardRecognition)
Identifikation af tekst på ID-kortet.
public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings
IDCardRecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.IDCardRecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Det genkender ID-kort med evnen til at angive Aspose.OCR.IDCardRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeInvoice(OcrInput)
Læs tekst på fakturaer.
public OcrOutput RecognizeInvoice(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Anerkender fakturaer med evnen til at angive Aspose.OCR.InvoiceRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
Læs tekst på fakturaer.
public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings
InvoiceRecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.InvoiceRecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Anerkender fakturaer med evnen til at angive Aspose.OCR.InvoiceRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeLines(OcrInput)
Det genkender billeder, der indeholder en enkelt tekstlinje.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public OcrOutput RecognizeLines(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
RecognizeLines(OcrInput og RecognitionSettings)
Det genkender billeder, der indeholder en enkelt tekstlinje.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, mappe, arrayer, arkiver.
public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings
RecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.RecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
RecognizePassport(OcrInput)
Læs tekst på pas.
public OcrOutput RecognizePassport(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Identificerer pass med evnen til at angive Aspose.OCR.PassportRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizePassport(OcrInput og PassportRecognition)
Læs tekst på pas.
public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings
PassportRecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.PassportRecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Identificerer pass med evnen til at angive Aspose.OCR.PassportRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeReceipt(OcrInput)
Læs tekst på modtagelser.
public OcrOutput RecognizeReceipt(OcrInput images)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Anerkender fakturaer med evnen til at angive Aspose.OCR.ReceiptRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
RecognizeReceipt(OcrInput, ReceiptRecognitionSettings)
Læs tekst på modtagelser.
public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)
Parameters
images
OcrInput
Den container med kilder.Aspose.OCR.OcrInput
settings
ReceiptRecognitionSettings
Anerkendelsesindstillinger Aspose.OCR.ReceiptRecognitionSettings.
Returns
Liste over Aspose.OCR.RecognitionResult objekter med billed genkendelsesresultater.
Remarks
Anerkender fakturaer med evnen til at angive Aspose.OCR.ReceiptRecognitionSettings.Støtter GIF, PNG, JPEG, BMP, TIFF, JFIF, strøm, katalog, arrayer, arkiver.
SaveMultipageDocument(string, SaveFormat, List, String, PdfOptimizationMode)
Tillader at få flere sider dokument fra listen over RecognitionResult-objekter
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
fullFileName
string
Filnavn med en vej til at redde genkendelse resulterer i det valgte format.
saveFormat
SaveFormat
Dokumentformat (Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results
List
<
RecognitionResult
>
Liste over Aspose.OCR.RecognitionResult objekter.
embeddedFontPath
string
Optionelt. fuld vej til brugeren font.
optimizePdf
PdfOptimizationMode
Reduktion af PDF-filstørrelsen ved at nedsætte kvaliteten af baggrundsbilleder.
SaveMultipageDocument(string, SaveFormat, List, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Tillader at få flere sider dokument fra listen over RecognitionResult-objekter
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
fullFileName
string
Filnavn med en vej til at redde genkendelse resulterer i det valgte format.
saveFormat
SaveFormat
Dokumentformat (Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results
List
<
RecognitionResult
>
Liste over Aspose.OCR.RecognitionResult objekter.
applySpellingCorrection
bool
Sæt troværdig til at korrigere forfalskede ord, hvis du har sådan i din anerkendelsesresultat.
language
SpellCheckLanguage
Ordet for spell check (valglig).
dictionaryPath
string
Optionelt. fuld vej til brugerordboken i .txt format. formatet er [ord - rum - frekvens(nummer)].Eksempel: 23135851162\nthat 3400031103\n
embeddedFontPath
string
Optionelt. fuld vej til brugeren font.
optimizePdf
PdfOptimizationMode
Reduktion af PDF-filstørrelsen ved at nedsætte kvaliteten af baggrundsbilleder.
SaveMultipageDocument(MemoryStream, SaveFormat, Liste, String, PdfOptimizationMode)
Tillader at få flere sider dokument fra listen over RecognitionResult-objekter
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
stream
MemoryStream
MemoryStream for at redde genkendelse resulterer i det valgte format.
saveFormat
SaveFormat
Dokumentformat (Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results
List
<
RecognitionResult
>
Liste over Aspose.OCR.RecognitionResult objekter.
embeddedFontPath
string
Optionelt. fuld vej til brugeren font.
optimizePdf
PdfOptimizationMode
Reduktion af PDF-filstørrelsen ved at nedsætte kvaliteten af baggrundsbilleder.
SaveMultipageDocument(MemoryStream, SaveFormat, Liste, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Tillader at få flere sider dokument fra listen over RecognitionResult-objekter
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
stream
MemoryStream
MemoryStream for at redde genkendelse resulterer i det valgte format.
saveFormat
SaveFormat
Dokumentformat (Docx, Txt, PDF, Xlsx, Rtf, Json, Xml).
results
List
<
RecognitionResult
>
Liste over Aspose.OCR.RecognitionResult objekter.
applySpellingCorrection
bool
Sæt troværdig til at korrigere forfalskede ord, hvis du har sådan i din anerkendelsesresultat.
language
SpellCheckLanguage
Ordet for spell check (valglig).
dictionaryPath
string
Optionelt. fuld vej til brugerordboken i .txt format. formatet er [ord - rum - frekvens(nummer)].Eksempel: 23135851162\nthat 3400031103\n
embeddedFontPath
string
Optionelt. fuld vej til brugeren font.
optimizePdf
PdfOptimizationMode
Reduktion af PDF-filstørrelsen ved at nedsætte kvaliteten af baggrundsbilleder.
OcrProgress
En begivenhed til at spore fremskridt i multi-page image recognition.
public event OcrRecognizeEventHandler OcrProgress