Class AsposeOcr
Namespace: Aspose.OCR
Assembly: Aspose.OCR.dll (25.1.0)
API principale pour la bibliothèque Aspose OCR
public class AsposeOcr
Héritage
Membres hérités
object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Constructeurs
AsposeOcr()
public AsposeOcr()
Méthodes
CalculateSkew(OcrInput)
Calcule les angles de skew d’une image.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, dossier, tableaux, archives.
public List<skewoutput> CalculateSkew(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
List<SkewOutput>
Liste des angles de skew en degrés Aspose.OCR.SkewOutput.
CompareImageTexts(string, string, RecognitionSettings, bool)
Vérifie si deux images contiennent le même texte.
public bool CompareImageTexts(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true)
Paramètres
fullPath1
string
Chemin vers la première image.
fullPath2
string
Chemin vers la deuxième image.
settings
RecognitionSettings
Paramètres de reconnaissance.
ignoreCase
bool
Vrai - signifie une recherche insensible à la casse.
Retourne
Vrai si les images ont le même texte (90% de similarité).
CorrectSpelling(string, SpellCheckLanguage, string)
Corrige le texte (remplace les mots mal orthographiés).
public string CorrectSpelling(string text, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null)
Paramètres
text
string
Texte à corriger.
language
SpellCheckLanguage
Dictionnaire à utiliser.
dictionaryPath
string
Optionnel. Chemin complet vers le dictionnaire utilisateur (dictionnaire de fréquence).
Format de fichier de dictionnaire :
Fichier texte brut en encodage UTF-8.
Le mot et la fréquence des mots sont séparés par un espace ou une tabulation. Par défaut, le mot est attendu dans la première colonne et la fréquence dans la deuxième colonne.
Chaque paire mot-fréquence sur une ligne séparée. Une ligne est définie comme une séquence de caractères suivie d’un saut de ligne ("\n"), d’un retour chariot ("\r"), ou d’un retour chariot immédiatement suivi d’un saut de ligne("\r\n").
Chaque mot est attendu en minuscules.
Retourne
Texte avec mots remplacés.
DetectDefects(OcrInput, DefectType)
Trouve automatiquement les zones problématiques d’une image qui peuvent avoir un impact significatif sur la précision de l’OCR.
Prend en charge les images PNG, JPEG, BMP, TIFF, JFIF et GIF fournies sous forme de fichier, de flux ou de tableau de pixels. Prend en charge la reconnaissance en masse.
public List<defectoutput> DetectDefects(OcrInput images, DefectType defectType)
Paramètres
images
OcrInput
Images sources Aspose.OCR.OcrInput
defectType
DefectType
Les types de défauts à reconnaître Aspose.OCR.DefectType
Retourne
List<DefectOutput>
Défauts d’image détectés ou une collection vide si aucun défaut n’est trouvé Aspose.OCR.DefectOutput.
DetectRectangles(OcrInput)
Détecte les zones de texte sur les images.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, dossier, tableaux, archives.
public List<rectangleoutput> DetectRectangles(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
List<RectangleOutput>
Liste d’Aspose.OCR.RectangleOutput avec les zones de texte ou lignes détectées.
DetectRectangles(OcrInput, AreasType, bool)
Détecte les zones de texte sur les images.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, dossier, tableaux, archives.
public List<rectangleoutput> DetectRectangles(OcrInput images, AreasType areasType, bool detectAreas = true)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
areasType
AreasType
Détermine quels rectangles retourner - lignes ou paragraphes.
detectAreas
bool
Active la détection automatique des zones de texte.
Retourne
List<RectangleOutput>
Liste d’Aspose.OCR.RectangleOutput avec les zones de texte ou lignes détectées.
ImageHasText(string, string, RecognitionSettings, bool, bool)
Vérifie si l’image contient le fragment de texte fourni.
public bool ImageHasText(string fullPath, string text, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Paramètres
fullPath
string
Chemin vers l’image.
text
string
Fragment de texte à rechercher sur l’image.
settings
RecognitionSettings
Paramètres de reconnaissance.
ignoreCase
bool
Vrai - signifie une recherche insensible à la casse.
autoSkew
bool
Active la correction automatique de l’inclinaison de l’image.
Retourne
Vrai si l’image contient le fragment de texte. Faux - l’image ne contient pas le fragment de texte.
Remarques
Reconnaît l’image avec la possibilité de spécifier Aspose.OCR.RecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageHasText(string, Regex, RecognitionSettings, bool)
Vérifie si le texte de l’image correspond à l’expression régulière fournie.
public bool ImageHasText(string fullPath, Regex regex, RecognitionSettings settings = null, bool autoSkew = true)
Paramètres
fullPath
string
Chemin vers l’image.
regex
Regex
Objet System.Text.RegularExpressions avec le motif et les options fournies.
settings
RecognitionSettings
Paramètres de reconnaissance.
autoSkew
bool
Active la correction automatique de l’inclinaison de l’image.
Retourne
Vrai si le texte de l’image correspond à l’expression régulière fournie.
Remarques
Reconnaît l’image avec la possibilité de spécifier Aspose.OCR.RecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF.
ImageTextDiff(string, string, RecognitionSettings, bool, bool)
Compare les textes sur les deux images et renvoie un nombre représentant leur similarité (0 à 1).
public float ImageTextDiff(string fullPath1, string fullPath2, RecognitionSettings settings = null, bool ignoreCase = true, bool autoSkew = true)
Paramètres
fullPath1
string
Chemin vers la première image.
fullPath2
string
Chemin vers la deuxième image.
settings
RecognitionSettings
Paramètres de reconnaissance.
ignoreCase
bool
Vrai - signifie une recherche insensible à la casse.
autoSkew
bool
Active la correction automatique de l’inclinaison de l’image.
Retourne
0 signifie que les textes sont complètement différents ; 1 signifie que les textes sont identiques.
Recognize(OcrInput)
Reconnaît le texte sur les images / documents.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
public OcrOutput Recognize(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Recognize(OcrInput, RecognitionSettings, CancellationToken)
Reconnaît le texte sur les images / documents.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings, CancellationToken cancellationToken)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
settings
RecognitionSettings
Paramètres de reconnaissance Aspose.OCR.RecognitionSettings.
cancellationToken
CancellationToken
Objet CancellationToken.
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Recognize(OcrInput, RecognitionSettings)
Reconnaît le texte sur les images / documents.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
public OcrOutput Recognize(OcrInput images, RecognitionSettings settings)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
settings
RecognitionSettings
Paramètres de reconnaissance Aspose.OCR.RecognitionSettings.
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
RecognizeCarPlate(OcrInput)
Reconnaît le texte sur la plaque d’immatriculation.
public OcrOutput RecognizeCarPlate(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Reconnaît les plaques d’immatriculation avec la possibilité de spécifier Aspose.OCR.CarPlateRecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
RecognizeCarPlate(OcrInput, CarPlateRecognitionSettings)
Reconnaît le texte sur la plaque d’immatriculation.
public OcrOutput RecognizeCarPlate(OcrInput images, CarPlateRecognitionSettings settings)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
settings
CarPlateRecognitionSettings
Paramètres de reconnaissance Aspose.OCR.CarPlateRecognitionSettings.
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Reconnaît les plaques d’immatriculation avec la possibilité de spécifier Aspose.OCR.CarPlateRecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
RecognizeCharacters(OcrInput)
Détecte les symboles sur les images.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, dossier, tableaux, archives.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
List<CharacterRecognitionResult>
Liste d’Aspose.OCR.CharacterRecognitionResult avec les données des symboles détectés.
RecognizeCharacters(OcrInput, DetectAreasMode, Language)
Détecte les symboles sur les images.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, dossier, tableaux, archives.
public List<characterrecognitionresult> RecognizeCharacters(OcrInput images, DetectAreasMode detectAreasMode = DetectAreasMode.UNIVERSAL, Language language = Language.Latin)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
detectAreasMode
DetectAreasMode
Détermine le type de réseau de neurones utilisé pour la détection des zones.
language
Language
Langue utilisée pour l’OCR.
Retourne
List<CharacterRecognitionResult>
Liste d’Aspose.OCR.Character avec les données des symboles détectés.
RecognizeFast(OcrInput)
Reconnaît le texte sur les images / documents.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
public List<string> RecognizeFast(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
Liste de chaînes avec les résultats de reconnaissance d’image.
RecognizeHandwrittenText(OcrInput)
Reconnaît le texte manuscrit sur les images.
public OcrOutput RecognizeHandwrittenText(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
RecognizeIDCard(OcrInput)
Reconnaît le texte sur la carte d’identité.
public OcrOutput RecognizeIDCard(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Reconnaît les cartes d’identité avec la possibilité de spécifier Aspose.OCR.IDCardRecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
RecognizeIDCard(OcrInput, IDCardRecognitionSettings)
Reconnaît le texte sur la carte d’identité.
public OcrOutput RecognizeIDCard(OcrInput images, IDCardRecognitionSettings settings)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
settings
IDCardRecognitionSettings
Paramètres de reconnaissance Aspose.OCR.IDCardRecognitionSettings.
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Reconnaît les cartes d’identité avec la possibilité de spécifier Aspose.OCR.IDCardRecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
RecognizeInvoice(OcrInput)
Reconnaît le texte sur les factures.
public OcrOutput RecognizeInvoice(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Reconnaît les factures avec la possibilité de spécifier Aspose.OCR.InvoiceRecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
RecognizeInvoice(OcrInput, InvoiceRecognitionSettings)
Reconnaît le texte sur les factures.
public OcrOutput RecognizeInvoice(OcrInput images, InvoiceRecognitionSettings settings)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
settings
InvoiceRecognitionSettings
Paramètres de reconnaissance Aspose.OCR.InvoiceRecognitionSettings.
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Reconnaît les factures avec la possibilité de spécifier Aspose.OCR.InvoiceRecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
RecognizeLines(OcrInput)
Reconnaît les images contenant une seule ligne de texte.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, dossier, tableaux, archives.
public OcrOutput RecognizeLines(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
RecognizeLines(OcrInput, RecognitionSettings)
Reconnaît les images contenant une seule ligne de texte.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, dossier, tableaux, archives.
public OcrOutput RecognizeLines(OcrInput images, RecognitionSettings settings)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
settings
RecognitionSettings
Paramètres de reconnaissance Aspose.OCR.RecognitionSettings.
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
RecognizePassport(OcrInput)
Reconnaît le texte sur le passeport.
public OcrOutput RecognizePassport(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Reconnaît les passeports avec la possibilité de spécifier Aspose.OCR.PassportRecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
RecognizePassport(OcrInput, PassportRecognitionSettings)
Reconnaît le texte sur le passeport.
public OcrOutput RecognizePassport(OcrInput images, PassportRecognitionSettings settings)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
settings
PassportRecognitionSettings
Paramètres de reconnaissance Aspose.OCR.PassportRecognitionSettings.
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Reconnaît les passeports avec la possibilité de spécifier Aspose.OCR.PassportRecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
RecognizeReceipt(OcrInput)
Reconnaît le texte sur les reçus.
public OcrOutput RecognizeReceipt(OcrInput images)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Reconnaît les factures avec la possibilité de spécifier Aspose.OCR.ReceiptRecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
RecognizeReceipt(OcrInput, ReceiptRecognitionSettings)
Reconnaît le texte sur les reçus.
public OcrOutput RecognizeReceipt(OcrInput images, ReceiptRecognitionSettings settings)
Paramètres
images
OcrInput
Le conteneur avec les sources. Aspose.OCR.OcrInput
settings
ReceiptRecognitionSettings
Paramètres de reconnaissance Aspose.OCR.ReceiptRecognitionSettings.
Retourne
Liste d’objets Aspose.OCR.RecognitionResult avec les résultats de reconnaissance d’image.
Remarques
Reconnaît les factures avec la possibilité de spécifier Aspose.OCR.ReceiptRecognitionSettings.
Prend en charge les formats GIF, PNG, JPEG, BMP, TIFF, JFIF, flux, répertoire, tableaux, archives.
SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)
Permet d’obtenir un document multipage à partir d’une liste d’objets RecognitionResult.
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Paramètres
fullFileName
string
Nom de fichier avec un chemin pour enregistrer le résultat de reconnaissance dans le format sélectionné.
saveFormat
SaveFormat
Format du document (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Liste d’objets Aspose.OCR.RecognitionResult.
embeddedFontPath
string
Optionnel. Chemin complet vers la police utilisateur.
optimizePdf
PdfOptimizationMode
Réduit la taille du fichier PDF en abaissant la qualité des images de fond. Par défaut, la qualité d’image originale est préservée.
SaveMultipageDocument(string, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Permet d’obtenir un document multipage à partir d’une liste d’objets RecognitionResult.
public static void SaveMultipageDocument(string fullFileName, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Paramètres
fullFileName
string
Nom de fichier avec un chemin pour enregistrer le résultat de reconnaissance dans le format sélectionné.
saveFormat
SaveFormat
Format du document (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Liste d’objets Aspose.OCR.RecognitionResult.
applySpellingCorrection
bool
Définir vrai pour corriger les mots mal orthographiés dans le cas où vous en avez dans votre résultat de reconnaissance.
language
SpellCheckLanguage
Dictionnaire pour la vérification orthographique (optionnel).
dictionaryPath
string
Optionnel. Chemin complet vers le dictionnaire utilisateur au format .txt. Le format est [mot - espace - fréquence(nombre)].
Exemple : le 23135851162\nthat 3400031103\n
embeddedFontPath
string
Optionnel. Chemin complet vers la police utilisateur.
optimizePdf
PdfOptimizationMode
Réduit la taille du fichier PDF en abaissant la qualité des images de fond. Par défaut, la qualité d’image originale est préservée.
SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, string, PdfOptimizationMode)
Permet d’obtenir un document multipage à partir d’une liste d’objets RecognitionResult.
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Paramètres
stream
MemoryStream
MemoryStream pour enregistrer le résultat de reconnaissance dans le format sélectionné.
saveFormat
SaveFormat
Format du document (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Liste d’objets Aspose.OCR.RecognitionResult.
embeddedFontPath
string
Optionnel. Chemin complet vers la police utilisateur.
optimizePdf
PdfOptimizationMode
Réduit la taille du fichier PDF en abaissant la qualité des images de fond. Par défaut, la qualité d’image originale est préservée.
SaveMultipageDocument(MemoryStream, SaveFormat, List<recognitionresult>, bool, SpellCheckLanguage, string, string, PdfOptimizationMode)
Permet d’obtenir un document multipage à partir d’une liste d’objets RecognitionResult.
public static void SaveMultipageDocument(MemoryStream stream, SaveFormat saveFormat, List<recognitionresult> results, bool applySpellingCorrection, SpellCheckLanguage language = SpellCheckLanguage.Eng, string dictionaryPath = null, string embeddedFontPath = null, PdfOptimizationMode optimizePdf = PdfOptimizationMode.MAXIMUM_QUALITY)
Paramètres
stream
MemoryStream
MemoryStream pour enregistrer le résultat de reconnaissance dans le format sélectionné.
saveFormat
SaveFormat
Format du document (Docx, Txt, Pdf, Xlsx, Rtf, Json, Xml).
results
List<RecognitionResult>
Liste d’objets Aspose.OCR.RecognitionResult.
applySpellingCorrection
bool
Définir vrai pour corriger les mots mal orthographiés dans le cas où vous en avez dans votre résultat de reconnaissance.
language
SpellCheckLanguage
Dictionnaire pour la vérification orthographique (optionnel).
dictionaryPath
string
Optionnel. Chemin complet vers le dictionnaire utilisateur au format .txt. Le format est [mot - espace - fréquence(nombre)].
Exemple : le 23135851162\nthat 3400031103\n
embeddedFontPath
string
Optionnel. Chemin complet vers la police utilisateur.
optimizePdf
PdfOptimizationMode
Réduit la taille du fichier PDF en abaissant la qualité des images de fond. Par défaut, la qualité d’image originale est préservée.
OcrProgress
Un événement pour suivre la progression de la reconnaissance d’images multipages.
public event OcrRecognizeEventHandler OcrProgress