Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

מייצג אפשרויות חילוץ טקסט עבור תוסף TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

ירושה

objectPdfExtractorOptionsTextExtractorOptions

מיישם

IPluginOptions

חברים שהורשו

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

דוגמאות

הדוגמה מדגימה כיצד לחלץ תוכן טקסט של מסמך PDF.

// צור אובייקט TextExtractor כדי לחלץ את תוכן ה-PDF
using (TextExtractor extractor = new TextExtractor())
{
    // צור אובייקט TextExtractorOptions כדי להגדיר את TextFormattingMode (Pure, או Raw - ברירת מחדל)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // הוסף את נתיב הקובץ לקבצי הקלט
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // בצע את תהליך החילוץ
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // קבל את הטקסט החולץ מאובייקט ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

הערות

אובייקט Aspose.Pdf.Plugins.TextExtractorOptions משמש כדי להגדיר את Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode ואפשרויות נוספות עבור פעולת חילוץ הטקסט.
בנוסף, הוא יורש פונקציות להוסיף נתונים (קבצים, זרמים) המייצגים מסמכי PDF קלט.

בונים

TextExtractorOptions(TextFormattingMode)

מאתחל מופע חדש של אובייקט Aspose.Pdf.Plugins.TextExtractorOptions עבור מצב עיצוב הטקסט המוגדר.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

פרמטרים

formattingMode TextExtractorOptions.TextFormattingMode

ערך מצב עיצוב הטקסט.

TextExtractorOptions()

מאתחל מופע חדש של אובייקט Aspose.Pdf.Plugins.TextExtractorOptions עם מצב עיצוב טקסט ‘Raw’ (ברירת מחדל).

public TextExtractorOptions()

מאפיינים

FormattingMode

מקבל את מצב העיצוב.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

ערך המאפיין

TextExtractorOptions.TextFormattingMode

OperationName

מחזיר את שם הפעולה.

public override string OperationName { get; }

ערך המאפיין

string

 Ελληνικά