Class AsposeOcr
Namespace: Aspose.OCR
Assembly: Aspose.OCR.dll (25.1.0)
Huvud-API för Aspose OCR-biblioteket
public class AsposeOcr
Arv
Arvade Medlemmar
object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Konstruktörer
AsposeOcr()
public AsposeOcr()
Metoder
CalculateSkew(OcrInput)
Beräknar lutningsvinklar för bilder. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, mapp, arrayer, arkiv.
public List<skewoutput> CalculateSkew(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
List<SkewOutput>
Lista över lutningsvinklar i grader Aspose.OCR.SkewOutput.
CompareImageTexts(string, string, RecognitionSettings, bool)
Kontrollerar om två bilder innehåller samma text.
public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)
Parametrar
fullPath1
string
Sökväg till den första bilden.
fullPath2
string
Sökväg till den andra bilden.
settings
RecognitionSettings
Inställningar för igenkänning.
ignoreCase
bool
True - betyder en skiftlägesokänslig sökning.
Returer
True om bilderna har samma text (90% likhet).
CorrectSpelling(string, SpellCheckLanguage, string)
Korrigerar text (ersätter felstavade ord).
public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)
Parametrar
text
string
Text för korrigering.
language
SpellCheckLanguage
Ordbok att använda.
dictionaryPath
string
Valfritt. Fullständig sökväg till användarordboken (frekvensordbok). Ordboksfilformat: Ren textfil i UTF-8-kodning. Ord och ordets frekvens separeras med ett mellanslag eller tab. Som standard förväntas ordet i den första kolumnen och frekvensen i den andra kolumnen. Varje ord-frekvens-par på en separat rad. En rad definieras som en sekvens av tecken följt av en radmatning ("\n"), en vagnretur ("\r"), eller en vagnretur direkt följt av en radmatning("\r\n"). Varje ord förväntas vara i gemener.
Returer
Text med ersatta ord.
DetectDefects(OcrInput, DefectType)
Automatiskt hitta problematiska områden i en bild som kan påverka noggrannheten av OCR avsevärt. Stöder PNG, JPEG, BMP, TIFF, JFIF och GIF-bilder som tillhandahålls som en fil, ström eller pixelarray. Stöder massigenkänning.
public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)
Parametrar
images
OcrInput
Källa bilder Aspose.OCR.OcrInput
defectType
DefectType
De typer av defekter som ska kännas igen Aspose.OCR.DefectType
Returer
List<DefectOutput>
Upptäckta bilddefekter eller en tom samling om ingen defekt hittades Aspose.OCR.DefectOutput.
DetectRectangles(OcrInput)
Upptäcker textområden på bilder. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, mapp, arrayer, arkiv.
public List<rectangleoutput> DetectRectangles(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
List<RectangleOutput>
Lista över Aspose.OCR.RectangleOutput med upptäckta textområden eller linjer.
DetectRectangles(OcrInput, AreasType, bool)
Upptäcker textområden på bilder. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, mapp, arrayer, arkiv.
public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
areasType
AreasType
Bestämmer vilka rektanglar som ska returneras - linje eller stycken.
detectAreas
bool
Aktivera automatisk upptäckts av textområden.
Returer
List<RectangleOutput>
Lista över Aspose.OCR.RectangleOutput med upptäckta textområden eller linjer.
ImageHasText(string, string, RecognitionSettings, bool, bool)
Kontrollerar om bilden innehåller det angivna textfragmentet.
public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Parametrar
fullPath
string
Sökväg till bilden.
text
string
Textfragment för sökning på bilden.
settings
RecognitionSettings
Inställningar för igenkänning.
ignoreCase
bool
True - betyder en skiftlägesokänslig sökning.
autoSkew
bool
Aktiverar automatisk korrigering av bildens lutning.
Returer
True om bilden innehåller textfragment. False - bilden innehåller inte textfragment.
Anmärkningar
Känner igen bilden med möjlighet att specificera Aspose.OCR.RecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageHasText(string, Regex, RecognitionSettings, bool)
Kontrollerar om bildtexten matchar det angivna reguljära uttrycket.
public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)
Parametrar
fullPath
string
Sökväg till bilden.
regex
Regex
System.Text.RegularExpressions-objekt med det angivna mönstret och alternativen.
settings
RecognitionSettings
Inställningar för igenkänning.
autoSkew
bool
Aktiverar automatisk korrigering av bildens lutning.
Returer
True om bildtexten matchar det angivna reguljära uttrycket.
Anmärkningar
Känner igen bilden med möjlighet att specificera Aspose.OCR.RecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageTextDiff(string, string, RecognitionSettings, bool, bool)
Jämför texterna på de två bilderna och returnerar ett tal som representerar hur lika de är (0 till 1).
public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Parametrar
fullPath1
string
Sökväg till den första bilden.
fullPath2
string
Sökväg till den andra bilden.
settings
RecognitionSettings
Inställningar för igenkänning.
ignoreCase
bool
True - betyder en skiftlägesokänslig sökning.
autoSkew
bool
Aktiverar automatisk korrigering av bildens lutning.
Returer
0 betyder att texterna är helt olika; 1 betyder att texterna är identiska.
Recognize(OcrInput)
Känner igen text på bilder / dokument. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
public OcrOutput Recognize(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Recognize(OcrInput, RecognitionSettings, CancellationToken)
Känner igen text på bilder / dokument. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
settings
RecognitionSettings
Inställningar för igenkänning Aspose.OCR.RecognitionSettings.
cancellationToken
CancellationToken
CancellationToken-objekt.
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Recognize(OcrInput, RecognitionSettings)
Känner igen text på bilder / dokument. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
settings
RecognitionSettings
Inställningar för igenkänning Aspose.OCR.RecognitionSettings.
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
RecognizeCarPlate(OcrInput)
Känner igen text på registreringsskylten.
public OcrOutput RecognizeCarPlate(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Känner igen registreringsskyltar med möjlighet att specificera Aspose.OCR.CarPlateRecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
RecognizeCarPlate(OcrInput, CarPlateRecognitionSettings)
Känner igen text på registreringsskylten.
public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
settings
CarPlateRecognitionSettings
Inställningar för igenkänning Aspose.OCR.CarPlateRecognitionSettings.
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Känner igen registreringsskyltar med möjlighet att specificera Aspose.OCR.CarPlateRecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
RecognizeCharacters(OcrInput)
Upptäcker symboler på bilder. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, mapp, arrayer, arkiv.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
List<CharacterRecognitionResult>
Lista över Aspose.OCR.CharacterRecognitionResult med upptäckta symboldata.
RecognizeCharacters(OcrInput, DetectAreasMode, Language)
Upptäcker symboler på bilder. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, mapp, arrayer, arkiv.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
detectAreasMode
DetectAreasMode
Bestämmer typen av neuralt nätverk som används för områdesupptäckten.
language
Language
Språk som används för OCR.
Returer
List<CharacterRecognitionResult>
Lista över Aspose.OCR.Character med upptäckta symboldata.
RecognizeFast(OcrInput)
Känner igen text på bilder / dokument. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
public List<string> RecognizeFast(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
Lista av strängar med bildigenkänningsresultat.
RecognizeHandwrittenText(OcrInput)
Känner igen handskriven text på bilder.
public OcrOutput RecognizeHandwrittenText(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
RecognizeIDCard(OcrInput)
Känner igen text på ID-kort.
public OcrOutput RecognizeIDCard(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Känner igen ID-kort med möjlighet att specificera Aspose.OCR.IDCardRecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
RecognizeIDCard(OcrInput, IDCardRecognitionSettings)
Känner igen text på ID-kort.
public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
settings
IDCardRecognitionSettings
Inställningar för igenkänning Aspose.OCR.IDCardRecognitionSettings.
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Känner igen ID-kort med möjlighet att specificera Aspose.OCR.IDCardRecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
RecognizeInvoice(OcrInput)
Känner igen text på fakturor.
public OcrOutput RecognizeInvoice(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Känner igen fakturor med möjlighet att specificera Aspose.OCR.InvoiceRecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
Känner igen text på fakturor.
public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
settings
InvoiceRecognitionSettings
Inställningar för igenkänning Aspose.OCR.InvoiceRecognitionSettings.
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Känner igen fakturor med möjlighet att specificera Aspose.OCR.InvoiceRecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
RecognizeLines(OcrInput)
Känner igen bilder som innehåller en enda rad text. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, mapp, arrayer, arkiv.
public OcrOutput RecognizeLines(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
RecognizeLines(OcrInput, RecognitionSettings)
Känner igen bilder som innehåller en enda rad text. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, mapp, arrayer, arkiv.
public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
settings
RecognitionSettings
Inställningar för igenkänning Aspose.OCR.RecognitionSettings.
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
RecognizePassport(OcrInput)
Känner igen text på pass.
public OcrOutput RecognizePassport(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Känner igen pass med möjlighet att specificera Aspose.OCR.PassportRecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
RecognizePassport(OcrInput, PassportRecognitionSettings)
Känner igen text på pass.
public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
settings
PassportRecognitionSettings
Inställningar för igenkänning Aspose.OCR.PassportRecognitionSettings.
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Känner igen pass med möjlighet att specificera Aspose.OCR.PassportRecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
RecognizeReceipt(OcrInput)
Känner igen text på kvitton.
public OcrOutput RecognizeReceipt(OcrInput images)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Känner igen fakturor med möjlighet att specificera Aspose.OCR.ReceiptRecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
RecognizeReceipt(OcrInput, ReceiptRecognitionSettings)
Känner igen text på kvitton.
public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)
Parametrar
images
OcrInput
Containern med källor. Aspose.OCR.OcrInput
settings
ReceiptRecognitionSettings
Inställningar för igenkänning Aspose.OCR.ReceiptRecognitionSettings.
Returer
Lista över Aspose.OCR.RecognitionResult-objekt med bildigenkänningsresultat.
Anmärkningar
Känner igen fakturor med möjlighet att specificera Aspose.OCR.ReceiptRecognitionSettings. Stöder GIF, PNG, JPEG, BMP, TIFF, JFIF, ström, katalog, arrayer, arkiv.
SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)
Möjliggör att få ett fler-sidigt dokument från en lista med RecognitionResult-objekt.
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parametrar
fullFileName
string
Filnamn med en sökväg för att spara igenkänningsresultatet i det valda formatet.
saveFormat
SaveFormat
Dokumentformat (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Lista över Aspose.OCR.RecognitionResult-objekt.
embeddedFontPath
string
Valfritt. Fullständig sökväg till användarens typsnitt.
optimizePdf
PdfOptimizationMode
Minska PDF-filens storlek genom att sänka kvaliteten på bakgrundsbilder. Som standard bevaras den ursprungliga bildkvaliteten.
SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Möjliggör att få ett fler-sidigt dokument från en lista med RecognitionResult-objekt.
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parametrar
fullFileName
string
Filnamn med en sökväg för att spara igenkänningsresultatet i det valda formatet.
saveFormat
SaveFormat
Dokumentformat (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Lista över Aspose.OCR.RecognitionResult-objekt.
applySpellingCorrection
bool
Sätt true för att korrigera felstavade ord om du har sådana i ditt igenkänningsresultat.
language
SpellCheckLanguage
Ordbok för stavningskontroll (valfritt).
dictionaryPath
string
Valfritt. Fullständig sökväg till användarordboken i .txt-format. Formatet är [ord - mellanslag - frekvens(antal)]. Exempel: the 23135851162\nthat 3400031103\n
embeddedFontPath
string
Valfritt. Fullständig sökväg till användarens typsnitt.
optimizePdf
PdfOptimizationMode
Minska PDF-filens storlek genom att sänka kvaliteten på bakgrundsbilder. Som standard bevaras den ursprungliga bildkvaliteten.
SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)
Möjliggör att få ett fler-sidigt dokument från en lista med RecognitionResult-objekt.
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parametrar
stream
MemoryStream
MemoryStream för att spara igenkänningsresultatet i det valda formatet.
saveFormat
SaveFormat
Dokumentformat (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Lista över Aspose.OCR.RecognitionResult-objekt.
embeddedFontPath
string
Valfritt. Fullständig sökväg till användarens typsnitt.
optimizePdf
PdfOptimizationMode
Minska PDF-filens storlek genom att sänka kvaliteten på bakgrundsbilder. Som standard bevaras den ursprungliga bildkvaliteten.
SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Möjliggör att få ett fler-sidigt dokument från en lista med RecognitionResult-objekt.
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parametrar
stream
MemoryStream
MemoryStream för att spara igenkänningsresultatet i det valda formatet.
saveFormat
SaveFormat
Dokumentformat (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Lista över Aspose.OCR.RecognitionResult-objekt.
applySpellingCorrection
bool
Sätt true för att korrigera felstavade ord om du har sådana i ditt igenkänningsresultat.
language
SpellCheckLanguage
Ordbok för stavningskontroll (valfritt).
dictionaryPath
string
Valfritt. Fullständig sökväg till användarordboken i .txt-format. Formatet är [ord - mellanslag - frekvens(antal)]. Exempel: the 23135851162\nthat 3400031103\n
embeddedFontPath
string
Valfritt. Fullständig sökväg till användarens typsnitt.
optimizePdf
PdfOptimizationMode
Minska PDF-filens storlek genom att sänka kvaliteten på bakgrundsbilder. Som standard bevaras den ursprungliga bildkvaliteten.
OcrProgress
Ett händelse för att spåra framstegen av fler-sidig bildigenkänning.
public event OcrRecognizeEventHandler OcrProgress