Class AsposeOcr
名称: Aspose.OCR 集合: Aspose.OCR.dll (25.4.0)
Aspose OCR 图书馆的主要 API
public class AsposeOcr : IDisposable
Inheritance
Implements
继承人
object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()
Constructors
AsposeOcr()
public AsposeOcr()
Methods
CalculateSkew(OcrInput)
计算图像的滑角。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。
public List<skewoutput> CalculateSkew(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
List < SkewOutput >
在 Aspose.OCR.SkewOutput 等级的滑角列表。
CompareImageTexts(字符串,字符串,识别设置,bool)
检查两个图像是否包含相同的文本。
public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)
Parameters
fullPath1
string
走向第一张图像。
fullPath2
string
走向第二张图像。
settings
RecognitionSettings
认可设置。
ignoreCase
bool
真實 - 意思是案例不敏感的搜尋。
Returns
如果图像具有相同的文本(90%的相似性)。
CorrectSpelling(字体, SpellCheckLanguage, 字体)
修正文本(取代错误的词语)。
public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)
Parameters
text
string
修正的文本。
language
SpellCheckLanguage
用字典。
dictionaryPath
string
可选. 完整的路径到用户词典(频率词典)。字典文件格式:平板文本文件在 UTF-8 编码。Word 和 Word 频率按空间或选项卡分开。默认情况下,在第一个列中预期的单词和第二个列中的频率。每个单词频率对一个单独的行.A 线被定义为一个字符的序列,其次是线源(“\n”),货运回归(“\r”),或即时返回货物,随之而来的线源(“\r\n”)。每个字都应该在较低的情况下。
Returns
用替代词语的文本。
DetectDefects(OcrInput , DefectType)
自动查找图像的问题区域,这可能会对OCR的准确性产生重大影响。支持 PNG、JPEG、BMP、TIFF、JFIF 和 GIF 图像作为文件、流或像素序列提供。
public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)
Parameters
images
OcrInput
圖片來源 Aspose.OCR.OcrInput
defectType
DefectType
要识别的缺陷类型 Aspose.OCR.DefectType
Returns
List < DefectOutput >
发现图像故障或 ab 空收集,如果没有发现 Aspose.OCR.DefectOutput 的故障。
DetectDocumentLayout(OcrInput)
分析图像并识别其内部的不同类型的内容区域。支持 PNG、JPEG、BMP、TIFF、JFIF 和 GIF 图像来自文件、流和像素序列。
public List<layoutoutput> DetectDocumentLayout(OcrInput images)
Parameters
images
OcrInput
圖片來源:Aspose.OCR.OcrInput
Returns
List < LayoutOutput >
发现的内容区域, Aspose.OCR.LayoutOutput。
DetectLanguages(OcrInput)
分析图像上的文本,以确定它所写的语言。它可以选择最合适的识别语言,并有助于进一步的文本处理任务,如 spellchecking 或翻译。
public List<languagedetectionoutput> DetectLanguages(OcrInput images)
Parameters
images
OcrInput
圖片來源 Aspose.OCR.OcrInput
Returns
List < LanguageDetectionOutput >
返回最可能的语言列表,按概率排名 Aspose.OCR.LanguageDetectionOutput。
DetectRectangles(OcrInput)
检测图像上的文本区域。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。
[Obsolete("Will be removed in the release 25.8.0")]
public List<rectangleoutput> DetectRectangles(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
List < RectangleOutput >
列表 Aspose.OCR.RectangleOutput 与检测到的文本区域或行。
DetectRectangles(OcrInput, 区域类型, bool)
检测图像上的文本区域。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。
public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
areasType
AreasType
决定重返直角 - 线或段落。
detectAreas
bool
可自动检测文本区域。
Returns
List < RectangleOutput >
列表 Aspose.OCR.RectangleOutput 与检测到的文本区域或行。
Dispose()
清晰的认可资源。
public void Dispose()
ImageHasText(字符串,字符串, 识别设置, bool, bool)
检查图像是否包含提供的文本片段。
public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Parameters
fullPath
string
走向图像的路
text
string
文本片段以搜索图像。
settings
RecognitionSettings
认可设置。
ignoreCase
bool
真實 - 意思是案例不敏感的搜尋。
autoSkew
bool
允许自动图像扫描纠正。
Returns
如果图像包含文本片段,则是真实的;假图像不包含文本片段。
Remarks
可识别图像,可指定 Aspose.OCR.RecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF。
ImageHasText(字符串, Regex, RecognitionSettings, bool)
检查图像文本是否符合提供的常规表达式。
public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)
Parameters
fullPath
string
走向图像的路
regex
Regex
System.Text.RegularExpressions 对象与提供的模式和选项。
settings
RecognitionSettings
认可设置。
autoSkew
bool
允许自动图像扫描纠正。
Returns
如果图像文本符合所提供的常规表达式。
Remarks
可识别图像,可指定 Aspose.OCR.RecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF。
ImageTextDiff(字符串,字符串, 识别设置, bool, bool)
比较两张图像的文本,然后返回一个数字,表明它们是多么相似(0到1)。
public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Parameters
fullPath1
string
走向第一张图像。
fullPath2
string
走向第二张图像。
settings
RecognitionSettings
认可设置。
ignoreCase
bool
真實 - 意思是案例不敏感的搜尋。
autoSkew
bool
允许自动图像扫描纠正。
Returns
0 意味着文本是完全不同的; 1 意味着文本是相同的。
Recognize(OcrInput)
在图像 / 文档上识别文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
public OcrOutput Recognize(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Recognize(OcrInput, RecognitionSettings, 取消Token)
在图像 / 文档上识别文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
settings
RecognitionSettings
识别设置 Aspose.OCR.RecognitionSettings。
cancellationToken
CancellationToken
取消对象。
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Recognize(OcrInput, 识别设置)
在图像 / 文档上识别文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
settings
RecognitionSettings
识别设置 Aspose.OCR.RecognitionSettings。
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
RecognizeCarPlate(OcrInput)
在车板上识别文本。
public OcrOutput RecognizeCarPlate(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
可识别汽车板,可指定 Aspose.OCR.CarPlateRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
RecognizeCarPlate(OcrInput, CarPlateRecognition 设置)
在车板上识别文本。
public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
settings
CarPlateRecognitionSettings
识别设置 Aspose.OCR.CarPlateRecognitionSettings。
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
可识别汽车板,可指定 Aspose.OCR.CarPlateRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
RecognizeCharacters(OcrInput)
在图像上检测符号。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
List < CharacterRecognitionResult >
列表 Aspose.OCR.CharacterRecognition 结果与检测的符号数据。
RecognizeCharacters(OcrInput, DetectAreasMode, 语言)
在图像上检测符号。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
detectAreasMode
DetectAreasMode
确定用于区域检测的神经网络的类型。
language
Language
使用 OCR 的语言
Returns
List < CharacterRecognitionResult >
列表 Aspose.OCR. 与检测符号数据的字符。
RecognizeFast(OcrInput)
在图像 / 文档上识别文本。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
public List<string> RecognizeFast(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
带有图像识别结果的线条列表。
RecognizeHandwrittenText(OcrInput)
识别图像上的手写文本。
public OcrOutput RecognizeHandwrittenText(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
识别IDCard(OcrInput)
识别身份证上的文本。
public OcrOutput RecognizeIDCard(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
识别 ID 卡,可指定 Aspose.OCR.IDCardRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
识别IDCard(OcrInput, IDCardRecognition 设置)
识别身份证上的文本。
public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
settings
IDCardRecognitionSettings
识别设置 Aspose.OCR.IDCardRecognitionSettings。
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
识别 ID 卡,可指定 Aspose.OCR.IDCardRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
RecognizeInvoice(OcrInput)
识别账单上的文本。
public OcrOutput RecognizeInvoice(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
识别账单,可指定 Aspose.OCR.InvoiceRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
RecognizeInvoice(OcrInput, InvoiceRecognition设置)
识别账单上的文本。
public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
settings
InvoiceRecognitionSettings
识别设置 Aspose.OCR.InvoiceRecognitionSettings。
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
识别账单,可指定 Aspose.OCR.InvoiceRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
RecognizeLines(OcrInput)
识别包含单一文本线的图像。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。
public OcrOutput RecognizeLines(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
RecognizeLines(OcrInput, 识别设置)
识别包含单一文本线的图像。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、文件夹、序列、档案。
public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
settings
RecognitionSettings
识别设置 Aspose.OCR.RecognitionSettings。
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
RecognizePassport(OcrInput)
通过护照识别文本。
public OcrOutput RecognizePassport(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
可识别护照,可指定 Aspose.OCR.PassportRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
RecognizePassport(OcrInput, PassportRecognition 设置)
通过护照识别文本。
public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
settings
PassportRecognitionSettings
识别设置 Aspose.OCR.PassportRecognitionSettings。
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
可识别护照,可指定 Aspose.OCR.PassportRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
RecognizeReceipt(OcrInput)
在接收中识别文本。
public OcrOutput RecognizeReceipt(OcrInput images)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
识别账单,可指定 Aspose.OCR.ReceiptRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
RecognizeReceipt(OcrInput, ReceiptRecognition设置)
在接收中识别文本。
public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)
Parameters
images
OcrInput
包含源的容器.Aspose.OCR.OcrInput
settings
ReceiptRecognitionSettings
识别设置 Aspose.OCR.ReceiptRecognitionSettings。
Returns
列表 Aspose.OCR.Recognition 图像识别结果的结果。
Remarks
识别账单,可指定 Aspose.OCR.ReceiptRecognitionSettings。支持 GIF、PNG、JPEG、BMP、TIFF、JFIF、流、目录、序列、档案。
SaveMultipageDocument(字符串, SaveFormat, List, 序列, PdfOptimizationMode)
允许从 RecognitionResult 对象列表中获取多页文件
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
fullFileName
string
带有存储识别路径的文件名在所选格式中获取结果。
saveFormat
SaveFormat
文件格式(Docx、Txt、PDF、Xlsx、Rtf、Json、Xml)
results
List
<
RecognitionResult
>
列表 Aspose.OCR.Recognition 结果对象。
embeddedFontPath
string
可选. 完整的路径到用户字体。
optimizePdf
PdfOptimizationMode
通过降低背景图像质量来减少 PDF 文件大小. 默认情况下,原始图像质量保留。
SaveMultipageDocument(字符串, SaveFormat, List, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
允许从 RecognitionResult 对象列表中获取多页文件
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
fullFileName
string
带有存储识别路径的文件名在所选格式中获取结果。
saveFormat
SaveFormat
文件格式(Docx、Txt、PDF、Xlsx、Rtf、Json、Xml)
results
List
<
RecognitionResult
>
列表 Aspose.OCR.Recognition 结果对象。
applySpellingCorrection
bool
设置正确修正错误的单词,如果您在您的认可结果中有这样一个。
language
SpellCheckLanguage
spell check(可选)的词典。
dictionaryPath
string
可选. 使用者字典的完整路径在 .txt 格式. 格式是 [字 - 空间 - 频率(数字)].示例: 23135851162\nthat 3400031103\n
embeddedFontPath
string
可选. 完整的路径到用户字体。
optimizePdf
PdfOptimizationMode
通过降低背景图像质量来减少 PDF 文件大小. 默认情况下,原始图像质量保留。
SaveMultipageDocument(MemoryStream, SaveFormat, 列表<识别结果>, 序列, PdfOptimizationMode)
允许从 RecognitionResult 对象列表中获取多页文件
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
stream
MemoryStream
MemoryStream for Saving Recognition 以所选择的格式获取。
saveFormat
SaveFormat
文件格式(Docx、Txt、PDF、Xlsx、Rtf、Json、Xml)
results
List
<
RecognitionResult
>
列表 Aspose.OCR.Recognition 结果对象。
embeddedFontPath
string
可选. 完整的路径到用户字体。
optimizePdf
PdfOptimizationMode
通过降低背景图像质量来减少 PDF 文件大小. 默认情况下,原始图像质量保留。
SaveMultipageDocument(MemoryStream, SaveFormat, 列表<识别结果>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
允许从 RecognitionResult 对象列表中获取多页文件
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parameters
stream
MemoryStream
MemoryStream for Saving Recognition 以所选择的格式获取。
saveFormat
SaveFormat
文件格式(Docx、Txt、PDF、Xlsx、Rtf、Json、Xml)
results
List
<
RecognitionResult
>
列表 Aspose.OCR.Recognition 结果对象。
applySpellingCorrection
bool
设置正确修正错误的单词,如果您在您的认可结果中有这样一个。
language
SpellCheckLanguage
spell check(可选)的词典。
dictionaryPath
string
可选. 使用者字典的完整路径在 .txt 格式. 格式是 [字 - 空间 - 频率(数字)].示例: 23135851162\nthat 3400031103\n
embeddedFontPath
string
可选. 完整的路径到用户字体。
optimizePdf
PdfOptimizationMode
通过降低背景图像质量来减少 PDF 文件大小. 默认情况下,原始图像质量保留。
OcrProgress
一个活动,以跟踪多页图像识别的进展。
public event OcrRecognizeEventHandler OcrProgress