Class AsposeOcr

名称: Aspose.OCR 集合: Aspose.OCR.dll (25.4.0)

Aspose OCR 图书馆的主要 API

public class AsposeOcr : IDisposable

Constructors

AsposeOcr()

public AsposeOcr()

Methods

CalculateSkew(OcrInput)

计算图像的滑角。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。

public List<skewoutput> CalculateSkew(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

List < SkewOutput >

在 Aspose.OCR.SkewOutput 等级的滑角列表。

CompareImageTexts(字符串,字符串,识别设置,bool)

检查两个图像是否包含相同的文本。

public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)

Parameters

fullPath1 string

走向第一张图像。

fullPath2 string

走向第二张图像。

settings RecognitionSettings

认可设置。

ignoreCase bool

真實 - 意思是案例不敏感的搜尋。

Returns

bool

如果图像具有相同的文本(90%的相似性)。

CorrectSpelling(字体, SpellCheckLanguage, 字体)

修正文本(取代错误的词语)。

public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)

Parameters

text string

修正的文本。

language SpellCheckLanguage

用字典。

dictionaryPath string

可选. 完整的路径到用户词典(频率词典)。字典文件格式:平板文本文件在 UTF-8 编码。Word 和 Word 频率按空间或选项卡分开。默认情况下,在第一个列中预期的单词和第二个列中的频率。每个单词频率对一个单独的行.A 线被定义为一个字符的序列,其次是线源(“\n”),货运回归(“\r”),或即时返回货物,随之而来的线源(“\r\n”)。每个字都应该在较低的情况下。

Returns

string

用替代词语的文本。

DetectDefects(OcrInput , DefectType)

自动查找图像的问题区域,这可能会对OCR的准确性产生重大影响。支持 PNG、JPEG、BMP、TIFF、JFIF 和 GIF 图像作为文件、流或像素序列提供。

public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)

Parameters

images OcrInput

圖片來源 Aspose.OCR.OcrInput

defectType DefectType

要识别的缺陷类型 Aspose.OCR.DefectType

Returns

List < DefectOutput >

发现图像故障或 ab 空收集,如果没有发现 Aspose.OCR.DefectOutput 的故障。

DetectDocumentLayout(OcrInput)

分析图像并识别其内部的不同类型的内容区域。支持 PNG、JPEG、BMP、TIFF、JFIF 和 GIF 图像来自文件、流和像素序列。

public List<layoutoutput> DetectDocumentLayout(OcrInput images)

Parameters

images OcrInput

圖片來源:Aspose.OCR.OcrInput

Returns

List < LayoutOutput >

发现的内容区域, Aspose.OCR.LayoutOutput。

DetectLanguages(OcrInput)

分析图像上的文本,以确定它所写的语言。它可以选择最合适的识别语言,并有助于进一步的文本处理任务,如 spellchecking 或翻译。

public List<languagedetectionoutput> DetectLanguages(OcrInput images)

Parameters

images OcrInput

圖片來源 Aspose.OCR.OcrInput

Returns

List < LanguageDetectionOutput >

返回最可能的语言列表,按概率排名 Aspose.OCR.LanguageDetectionOutput。

DetectRectangles(OcrInput)

检测图像上的文本区域。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。

[Obsolete("Will be removed in the release 25.8.0")]
public List<rectangleoutput> DetectRectangles(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

List < RectangleOutput >

列表 Aspose.OCR.RectangleOutput 与检测到的文本区域或行。

DetectRectangles(OcrInput, 区域类型, bool)

检测图像上的文本区域。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。

public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

areasType AreasType

决定重返直角 - 线或段落。

detectAreas bool

可自动检测文本区域。

Returns

List < RectangleOutput >

列表 Aspose.OCR.RectangleOutput 与检测到的文本区域或行。

Dispose()

清晰的认可资源。

public void Dispose()

ImageHasText(字符串,字符串, 识别设置, bool, bool)

检查图像是否包含提供的文本片段。

public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)

Parameters

fullPath string

走向图像的路

text string

文本片段以搜索图像。

settings RecognitionSettings

认可设置。

ignoreCase bool

真實 - 意思是案例不敏感的搜尋。

autoSkew bool

允许自动图像扫描纠正。

Returns

bool

如果图像包含文本片段,则是真实的;假图像不包含文本片段。

Remarks

可识别图像,可指定 Aspose.OCR.RecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF。

ImageHasText(字符串, Regex, RecognitionSettings, bool)

检查图像文本是否符合提供的常规表达式。

public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)

Parameters

fullPath string

走向图像的路

regex Regex

System.Text.RegularExpressions 对象与提供的模式和选项。

settings RecognitionSettings

认可设置。

autoSkew bool

允许自动图像扫描纠正。

Returns

bool

如果图像文本符合所提供的常规表达式。

Remarks

可识别图像,可指定 Aspose.OCR.RecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF。

ImageTextDiff(字符串,字符串, 识别设置, bool, bool)

比较两张图像的文本,然后返回一个数字,表明它们是多么相似(0到1)。

public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)

Parameters

fullPath1 string

走向第一张图像。

fullPath2 string

走向第二张图像。

settings RecognitionSettings

认可设置。

ignoreCase bool

真實 - 意思是案例不敏感的搜尋。

autoSkew bool

允许自动图像扫描纠正。

Returns

float

0 意味着文本是完全不同的; 1 意味着文本是相同的。

Recognize(OcrInput)

在图像 / 文档上识别文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

public OcrOutput Recognize(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Recognize(OcrInput, RecognitionSettings, 取消Token)

在图像 / 文档上识别文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

settings RecognitionSettings

识别设置 Aspose.OCR.RecognitionSettings。

cancellationToken CancellationToken

取消对象。

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Recognize(OcrInput, 识别设置)

在图像 / 文档上识别文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

settings RecognitionSettings

识别设置 Aspose.OCR.RecognitionSettings。

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

RecognizeCarPlate(OcrInput)

在车板上识别文本。

public OcrOutput RecognizeCarPlate(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

可识别汽车板,可指定 Aspose.OCR.CarPlateRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

RecognizeCarPlate(OcrInput, CarPlateRecognition 设置)

在车板上识别文本。

public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

settings CarPlateRecognitionSettings

识别设置 Aspose.OCR.CarPlateRecognitionSettings。

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

可识别汽车板,可指定 Aspose.OCR.CarPlateRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

RecognizeCharacters(OcrInput)

在图像上检测符号。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。

public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

List < CharacterRecognitionResult >

列表 Aspose.OCR.CharacterRecognition 结果与检测的符号数据。

RecognizeCharacters(OcrInput, DetectAreasMode, 语言)

在图像上检测符号。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。

public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

detectAreasMode DetectAreasMode

确定用于区域检测的神经网络的类型。

language Language

使用 OCR 的语言

Returns

List < CharacterRecognitionResult >

列表 Aspose.OCR. 与检测符号数据的字符。

RecognizeFast(OcrInput)

在图像 / 文档上识别文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

public List<string> RecognizeFast(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

List < string >

带有图像识别结果的线条列表。

RecognizeHandwrittenText(OcrInput)

识别图像上的手写文本。

public OcrOutput RecognizeHandwrittenText(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

识别IDCard(OcrInput)

识别身份证上的文本。

public OcrOutput RecognizeIDCard(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

识别 ID 卡,可指定 Aspose.OCR.IDCardRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

识别IDCard(OcrInput, IDCardRecognition 设置)

识别身份证上的文本。

public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

settings IDCardRecognitionSettings

识别设置 Aspose.OCR.IDCardRecognitionSettings。

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

识别 ID 卡,可指定 Aspose.OCR.IDCardRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

RecognizeInvoice(OcrInput)

识别账单上的文本。

public OcrOutput RecognizeInvoice(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

识别账单,可指定 Aspose.OCR.InvoiceRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

RecognizeInvoice(OcrInput, InvoiceRecognition设置)

识别账单上的文本。

public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

settings InvoiceRecognitionSettings

识别设置 Aspose.OCR.InvoiceRecognitionSettings。

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

识别账单,可指定 Aspose.OCR.InvoiceRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

RecognizeLines(OcrInput)

识别包含单一文本线的图像。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。

public OcrOutput RecognizeLines(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

RecognizeLines(OcrInput, 识别设置)

识别包含单一文本线的图像。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。

public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

settings RecognitionSettings

识别设置 Aspose.OCR.RecognitionSettings。

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

RecognizePassport(OcrInput)

通过护照识别文本。

public OcrOutput RecognizePassport(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

可识别护照,可指定 Aspose.OCR.PassportRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

RecognizePassport(OcrInput, PassportRecognition 设置)

通过护照识别文本。

public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

settings PassportRecognitionSettings

识别设置 Aspose.OCR.PassportRecognitionSettings。

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

可识别护照,可指定 Aspose.OCR.PassportRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

RecognizeReceipt(OcrInput)

在接收中识别文本。

public OcrOutput RecognizeReceipt(OcrInput images)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

识别账单,可指定 Aspose.OCR.ReceiptRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

RecognizeReceipt(OcrInput, ReceiptRecognition设置)

在接收中识别文本。

public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)

Parameters

images OcrInput

包含源的容器.Aspose.OCR.OcrInput

settings ReceiptRecognitionSettings

识别设置 Aspose.OCR.ReceiptRecognitionSettings。

Returns

OcrOutput

列表 Aspose.OCR.Recognition 图像识别结果的结果。

Remarks

识别账单,可指定 Aspose.OCR.ReceiptRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。

SaveMultipageDocument(字符串, SaveFormat, List, 序列, PdfOptimizationMode)

允许从 RecognitionResult 对象列表中获取多页文件

public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Parameters

fullFileName string

带有存储识别路径的文件名在所选格式中获取结果。

saveFormat SaveFormat

文件格式(Docx、Txt、PDF、Xlsx、Rtf、Json、Xml)

results List < RecognitionResult >

列表 Aspose.OCR.Recognition 结果对象。

embeddedFontPath string

可选. 完整的路径到用户字体。

optimizePdf PdfOptimizationMode

通过降低背景图像质量来减少 PDF 文件大小. 默认情况下,原始图像质量保留。

SaveMultipageDocument(字符串, SaveFormat, List, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)

允许从 RecognitionResult 对象列表中获取多页文件

public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Parameters

fullFileName string

带有存储识别路径的文件名在所选格式中获取结果。

saveFormat SaveFormat

文件格式(Docx、Txt、PDF、Xlsx、Rtf、Json、Xml)

results List < RecognitionResult >

列表 Aspose.OCR.Recognition 结果对象。

applySpellingCorrection bool

设置正确修正错误的单词,如果您在您的认可结果中有这样一个。

language SpellCheckLanguage

spell check(可选)的词典。

dictionaryPath string

可选. 使用者字典的完整路径在 .txt 格式. 格式是 [字 - 空间 - 频率(数字)].示例: 23135851162\nthat 3400031103\n

embeddedFontPath string

可选. 完整的路径到用户字体。

optimizePdf PdfOptimizationMode

通过降低背景图像质量来减少 PDF 文件大小. 默认情况下,原始图像质量保留。

SaveMultipageDocument(MemoryStream, SaveFormat, 列表<识别结果>, 序列, PdfOptimizationMode)

允许从 RecognitionResult 对象列表中获取多页文件

public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Parameters

stream MemoryStream

MemoryStream for Saving Recognition 以所选择的格式获取。

saveFormat SaveFormat

文件格式(Docx、Txt、PDF、Xlsx、Rtf、Json、Xml)

results List < RecognitionResult >

列表 Aspose.OCR.Recognition 结果对象。

embeddedFontPath string

可选. 完整的路径到用户字体。

optimizePdf PdfOptimizationMode

通过降低背景图像质量来减少 PDF 文件大小. 默认情况下,原始图像质量保留。

SaveMultipageDocument(MemoryStream, SaveFormat, 列表<识别结果>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)

允许从 RecognitionResult 对象列表中获取多页文件

public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)

Parameters

stream MemoryStream

MemoryStream for Saving Recognition 以所选择的格式获取。

saveFormat SaveFormat

文件格式(Docx、Txt、PDF、Xlsx、Rtf、Json、Xml)

results List < RecognitionResult >

列表 Aspose.OCR.Recognition 结果对象。

applySpellingCorrection bool

设置正确修正错误的单词,如果您在您的认可结果中有这样一个。

language SpellCheckLanguage

spell check(可选)的词典。

dictionaryPath string

可选. 使用者字典的完整路径在 .txt 格式. 格式是 [字 - 空间 - 频率(数字)].示例: 23135851162\nthat 3400031103\n

embeddedFontPath string

可选. 完整的路径到用户字体。

optimizePdf PdfOptimizationMode

通过降低背景图像质量来减少 PDF 文件大小. 默认情况下,原始图像质量保留。

OcrProgress

一个活动,以跟踪多页图像识别的进展。

public event OcrRecognizeEventHandler OcrProgress

事件类型

OcrRecognizeEventHandler

Class AsposeOcr

Inheritance

Implements

继承人

Constructors

AsposeOcr()

Methods

CalculateSkew(OcrInput)

Parameters

Returns

CompareImageTexts(字符串,字符串,识别设置,bool)

Parameters

Returns

CorrectSpelling(字体, SpellCheckLanguage, 字体)

Parameters

Returns

DetectDefects(OcrInput , DefectType)

Parameters

Returns

DetectDocumentLayout(OcrInput)

Parameters

Returns

DetectLanguages(OcrInput)

Parameters

Returns

DetectRectangles(OcrInput)

Parameters

Returns

DetectRectangles(OcrInput, 区域类型, bool)

Parameters

Returns

Dispose()

ImageHasText(字符串,字符串, 识别设置, bool, bool)

Parameters

Returns

Remarks

ImageHasText(字符串, Regex, RecognitionSettings, bool)

Parameters

Returns

Remarks

ImageTextDiff(字符串,字符串, 识别设置, bool, bool)

Parameters

Returns

Recognize(OcrInput)

Parameters

Returns

Recognize(OcrInput, RecognitionSettings, 取消Token)

Parameters

Returns

Recognize(OcrInput, 识别设置)

Parameters

Returns

RecognizeCarPlate(OcrInput)

Parameters

Returns

Remarks

RecognizeCarPlate(OcrInput, CarPlateRecognition 设置)

Parameters

Returns

Remarks

RecognizeCharacters(OcrInput)

Parameters

Returns

RecognizeCharacters(OcrInput, DetectAreasMode, 语言)

Parameters

Returns

RecognizeFast(OcrInput)

Parameters

Returns

RecognizeHandwrittenText(OcrInput)

Parameters

Returns

Remarks

识别IDCard(OcrInput)

Parameters

Returns

Remarks

识别IDCard(OcrInput, IDCardRecognition 设置)

Parameters

Returns