Class AsposeOcr
Namespace: Aspose.OCR
Assembly: Aspose.OCR.dll (25.1.0)
API principal para a biblioteca Aspose OCR
public class AsposeOcr
Herança
Membros Herdados
object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Construtores
AsposeOcr()
public AsposeOcr()
Métodos
CalculateSkew(OcrInput)
Calcula os ângulos de inclinação de uma imagem. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, pasta, arrays, arquivos.
public List<skewoutput> CalculateSkew(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
List<SkewOutput>
Lista de ângulos de inclinação em graus Aspose.OCR.SkewOutput.
CompareImageTexts(string, string, RecognitionSettings, bool)
Verifica se duas imagens contêm o mesmo texto.
public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)
Parâmetros
fullPath1
string
Caminho para a primeira imagem.
fullPath2
string
Caminho para a segunda imagem.
settings
RecognitionSettings
Configurações de reconhecimento.
ignoreCase
bool
True - significa uma busca sem diferenciação entre maiúsculas e minúsculas.
Retorna
True se as imagens tiverem o mesmo texto (90% de similaridade).
CorrectSpelling(string, SpellCheckLanguage, string)
Corrige o texto (substitui palavras com erro de ortografia).
public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)
Parâmetros
text
string
Texto para correção.
language
SpellCheckLanguage
Dicionário a ser utilizado.
dictionaryPath
string
Opcional. Caminho completo para o dicionário do usuário (dicionário de frequência). Formato do arquivo do dicionário: Arquivo de texto simples em codificação UTF-8. Palavra e frequência da palavra são separadas por espaço ou tabulação. Por padrão, a palavra é esperada na primeira coluna e a frequência na segunda coluna. Cada par palavra-frequência em uma linha separada. Uma linha é definida como uma sequência de caracteres seguida por uma quebra de linha ("\n"), uma retorno de carro ("\r"), ou um retorno de carro imediatamente seguido por uma quebra de linha("\r\n"). Cada palavra deve estar em letras minúsculas.
Retorna
Texto com palavras substituídas.
DetectDefects(OcrInput, DefectType)
Encontra automaticamente áreas problemáticas de uma imagem que podem impactar significativamente a precisão do OCR. Suporta imagens PNG, JPEG, BMP, TIFF, JFIF e GIF fornecidas como arquivo, stream ou array de pixels. Suporta reconhecimento em massa.
public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)
Parâmetros
images
OcrInput
Imagens de origem Aspose.OCR.OcrInput
defectType
DefectType
Os tipos de defeitos a serem reconhecidos Aspose.OCR.DefectType
Retorna
List<DefectOutput>
Defeitos de imagem detectados ou uma coleção vazia se nenhum defeito for encontrado Aspose.OCR.DefectOutput.
DetectRectangles(OcrInput)
Detecta áreas de texto em imagens. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, pasta, arrays, arquivos.
public List<rectangleoutput> DetectRectangles(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
List<RectangleOutput>
Lista de Aspose.OCR.RectangleOutput com áreas de texto ou linhas detectadas.
DetectRectangles(OcrInput, AreasType, bool)
Detecta áreas de texto em imagens. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, pasta, arrays, arquivos.
public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
areasType
AreasType
Determina quais retângulos retornar - linha ou parágrafos.
detectAreas
bool
Habilita a detecção automática de áreas de texto.
Retorna
List<RectangleOutput>
Lista de Aspose.OCR.RectangleOutput com áreas de texto ou linhas detectadas.
ImageHasText(string, string, RecognitionSettings, bool, bool)
Verifica se a imagem contém o fragmento de texto fornecido.
public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Parâmetros
fullPath
string
Caminho para a imagem.
text
string
Fragmento de texto para busca na imagem.
settings
RecognitionSettings
Configurações de reconhecimento.
ignoreCase
bool
True - significa uma busca sem diferenciação entre maiúsculas e minúsculas.
autoSkew
bool
Habilita a correção automática da inclinação da imagem.
Retorna
True se a imagem contém o fragmento de texto. False - a imagem não contém o fragmento de texto.
Observações
Reconhece a imagem com a capacidade de especificar Aspose.OCR.RecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageHasText(string, Regex, RecognitionSettings, bool)
Verifica se o texto da imagem corresponde à expressão regular fornecida.
public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)
Parâmetros
fullPath
string
Caminho para a imagem.
regex
Regex
Objeto System.Text.RegularExpressions com o padrão e opções fornecidos.
settings
RecognitionSettings
Configurações de reconhecimento.
autoSkew
bool
Habilita a correção automática da inclinação da imagem.
Retorna
True se o texto da imagem corresponder à expressão regular fornecida.
Observações
Reconhece a imagem com a capacidade de especificar Aspose.OCR.RecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageTextDiff(string, string, RecognitionSettings, bool, bool)
Compara os textos nas duas imagens e retorna um número representando quão semelhantes eles são (0 a 1).
public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Parâmetros
fullPath1
string
Caminho para a primeira imagem.
fullPath2
string
Caminho para a segunda imagem.
settings
RecognitionSettings
Configurações de reconhecimento.
ignoreCase
bool
True - significa uma busca sem diferenciação entre maiúsculas e minúsculas.
autoSkew
bool
Habilita a correção automática da inclinação da imagem.
Retorna
0 significa que os textos são completamente diferentes; 1 significa que os textos são idênticos.
Recognize(OcrInput)
Reconhece texto em imagens / documentos. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
public OcrOutput Recognize(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Recognize(OcrInput, RecognitionSettings, CancellationToken)
Reconhece texto em imagens / documentos. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
settings
RecognitionSettings
Configurações de reconhecimento Aspose.OCR.RecognitionSettings.
cancellationToken
CancellationToken
Objeto CancellationToken.
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Recognize(OcrInput, RecognitionSettings)
Reconhece texto em imagens / documentos. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
settings
RecognitionSettings
Configurações de reconhecimento Aspose.OCR.RecognitionSettings.
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
RecognizeCarPlate(OcrInput)
Reconhece texto em placas de carro.
public OcrOutput RecognizeCarPlate(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Reconhece placas de carro com a capacidade de especificar Aspose.OCR.CarPlateRecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
RecognizeCarPlate(OcrInput, CarPlateRecognitionSettings)
Reconhece texto em placas de carro.
public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
settings
CarPlateRecognitionSettings
Configurações de reconhecimento Aspose.OCR.CarPlateRecognitionSettings.
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Reconhece placas de carro com a capacidade de especificar Aspose.OCR.CarPlateRecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
RecognizeCharacters(OcrInput)
Detecta símbolos em imagens. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, pasta, arrays, arquivos.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
List<CharacterRecognitionResult>
Lista de Aspose.OCR.CharacterRecognitionResult com dados de símbolos detectados.
RecognizeCharacters(OcrInput, DetectAreasMode, Language)
Detecta símbolos em imagens. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, pasta, arrays, arquivos.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
detectAreasMode
DetectAreasMode
Determina o tipo de rede neural usada para a detecção de áreas.
language
Language
Idioma usado para OCR.
Retorna
List<CharacterRecognitionResult>
Lista de Aspose.OCR.Character com dados de símbolos detectados.
RecognizeFast(OcrInput)
Reconhece texto em imagens / documentos. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
public List<string> RecognizeFast(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
Lista de strings com resultados do reconhecimento da imagem.
RecognizeHandwrittenText(OcrInput)
Reconhece texto manuscrito em imagens.
public OcrOutput RecognizeHandwrittenText(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
RecognizeIDCard(OcrInput)
Reconhece texto em carteiras de identidade.
public OcrOutput RecognizeIDCard(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Reconhece carteiras de identidade com a capacidade de especificar Aspose.OCR.IDCardRecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
RecognizeIDCard(OcrInput, IDCardRecognitionSettings)
Reconhece texto em carteiras de identidade.
public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
settings
IDCardRecognitionSettings
Configurações de reconhecimento Aspose.OCR.IDCardRecognitionSettings.
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Reconhece carteiras de identidade com a capacidade de especificar Aspose.OCR.IDCardRecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
RecognizeInvoice(OcrInput)
Reconhece texto em faturas.
public OcrOutput RecognizeInvoice(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Reconhece faturas com a capacidade de especificar Aspose.OCR.InvoiceRecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
Reconhece texto em faturas.
public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
settings
InvoiceRecognitionSettings
Configurações de reconhecimento Aspose.OCR.InvoiceRecognitionSettings.
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Reconhece faturas com a capacidade de especificar Aspose.OCR.InvoiceRecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
RecognizeLines(OcrInput)
Reconhece imagens que contêm uma única linha de texto. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, pasta, arrays, arquivos.
public OcrOutput RecognizeLines(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
RecognizeLines(OcrInput, RecognitionSettings)
Reconhece imagens que contêm uma única linha de texto. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, pasta, arrays, arquivos.
public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
settings
RecognitionSettings
Configurações de reconhecimento Aspose.OCR.RecognitionSettings.
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
RecognizePassport(OcrInput)
Reconhece texto em passaportes.
public OcrOutput RecognizePassport(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Reconhece passaportes com a capacidade de especificar Aspose.OCR.PassportRecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
RecognizePassport(OcrInput, PassportRecognitionSettings)
Reconhece texto em passaportes.
public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
settings
PassportRecognitionSettings
Configurações de reconhecimento Aspose.OCR.PassportRecognitionSettings.
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Reconhece passaportes com a capacidade de especificar Aspose.OCR.PassportRecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
RecognizeReceipt(OcrInput)
Reconhece texto em recibos.
public OcrOutput RecognizeReceipt(OcrInput images)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Reconhece faturas com a capacidade de especificar Aspose.OCR.ReceiptRecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
RecognizeReceipt(OcrInput, ReceiptRecognitionSettings)
Reconhece texto em recibos.
public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)
Parâmetros
images
OcrInput
O contêiner com as fontes.Aspose.OCR.OcrInput
settings
ReceiptRecognitionSettings
Configurações de reconhecimento Aspose.OCR.ReceiptRecognitionSettings.
Retorna
Lista de objetos Aspose.OCR.RecognitionResult com os resultados do reconhecimento da imagem.
Observações
Reconhece faturas com a capacidade de especificar Aspose.OCR.ReceiptRecognitionSettings. Suporta GIF, PNG, JPEG, BMP, TIFF, JFIF, stream, diretório, arrays, arquivos.
SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)
Permite obter um documento multipágina a partir da lista de objetos RecognitionResult
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parâmetros
fullFileName
string
Nome do arquivo com um caminho para salvar o resultado do reconhecimento no formato selecionado.
saveFormat
SaveFormat
Formato do documento (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Lista de objetos Aspose.OCR.RecognitionResult.
embeddedFontPath
string
Opcional. Caminho completo para a fonte do usuário.
optimizePdf
PdfOptimizationMode
Reduz o tamanho do arquivo PDF diminuindo a qualidade das imagens de fundo. Por padrão, a qualidade da imagem original é preservada.
SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Permite obter um documento multipágina a partir da lista de objetos RecognitionResult
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parâmetros
fullFileName
string
Nome do arquivo com um caminho para salvar o resultado do reconhecimento no formato selecionado.
saveFormat
SaveFormat
Formato do documento (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Lista de objetos Aspose.OCR.RecognitionResult.
applySpellingCorrection
bool
Defina como true para corrigir palavras com erro de ortografia caso tenha alguma no seu resultado de reconhecimento.
language
SpellCheckLanguage
Dicionário para verificação ortográfica (opcional).
dictionaryPath
string
Opcional. Caminho completo para o dicionário do usuário em formato .txt. O formato é [palavra - espaço - frequência(número)]. Exemplo: a 23135851162\nque 3400031103\n
embeddedFontPath
string
Opcional. Caminho completo para a fonte do usuário.
optimizePdf
PdfOptimizationMode
Reduz o tamanho do arquivo PDF diminuindo a qualidade das imagens de fundo. Por padrão, a qualidade da imagem original é preservada.
SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)
Permite obter um documento multipágina a partir da lista de objetos RecognitionResult
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parâmetros
stream
MemoryStream
MemoryStream para salvar o resultado do reconhecimento no formato selecionado.
saveFormat
SaveFormat
Formato do documento (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Lista de objetos Aspose.OCR.RecognitionResult.
embeddedFontPath
string
Opcional. Caminho completo para a fonte do usuário.
optimizePdf
PdfOptimizationMode
Reduz o tamanho do arquivo PDF diminuindo a qualidade das imagens de fundo. Por padrão, a qualidade da imagem original é preservada.
SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Permite obter um documento multipágina a partir da lista de objetos RecognitionResult
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Parâmetros
stream
MemoryStream
MemoryStream para salvar o resultado do reconhecimento no formato selecionado.
saveFormat
SaveFormat
Formato do documento (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Lista de objetos Aspose.OCR.RecognitionResult.
applySpellingCorrection
bool
Defina como true para corrigir palavras com erro de ortografia caso tenha alguma no seu resultado de reconhecimento.
language
SpellCheckLanguage
Dicionário para verificação ortográfica (opcional).
dictionaryPath
string
Opcional. Caminho completo para o dicionário do usuário em formato .txt. O formato é [palavra - espaço - frequência(número)]. Exemplo: a 23135851162\nque 3400031103\n
embeddedFontPath
string
Opcional. Caminho completo para a fonte do usuário.
optimizePdf
PdfOptimizationMode
Reduz o tamanho do arquivo PDF diminuindo a qualidade das imagens de fundo. Por padrão, a qualidade da imagem original é preservada.
OcrProgress
Um evento para rastrear o progresso do reconhecimento de imagens multipágina.
public event OcrRecognizeEventHandler OcrProgress