Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

يمثل خيارات استخراج النص لملحق TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

الوراثة

objectPdfExtractorOptionsTextExtractorOptions

التنفيذ

IPluginOptions

الأعضاء الموروثة

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

أمثلة

توضح هذه المثال كيفية استخراج محتوى النص من مستند PDF.

// إنشاء كائن TextExtractor لاستخراج محتويات PDF
using (TextExtractor extractor = new TextExtractor())
{
    // إنشاء كائن TextExtractorOptions لتعيين TextFormattingMode (نقي، أو خام - الافتراضي)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // إضافة مسار ملف الإدخال إلى مصادر البيانات
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // تنفيذ عملية الاستخراج
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // الحصول على النص المستخرج من كائن ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

ملاحظات

يستخدم كائن Aspose.Pdf.Plugins.TextExtractorOptions لتعيين Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode وخيارات أخرى لعملية استخراج النص. أيضًا، يرث وظائف لإضافة بيانات (ملفات، تدفقات) تمثل مستندات PDF المدخلة.

المنشئات

TextExtractorOptions(TextFormattingMode)

يبدأ مثيلًا جديدًا من كائن Aspose.Pdf.Plugins.TextExtractorOptions لوضع تنسيق النص المحدد.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

المعلمات

formattingMode TextExtractorOptions.TextFormattingMode

قيمة وضع تنسيق النص.

TextExtractorOptions()

يبدأ مثيلًا جديدًا من كائن Aspose.Pdf.Plugins.TextExtractorOptions مع وضع تنسيق النص “خام” (الافتراضي).

public TextExtractorOptions()

الخصائص

FormattingMode

يحصل على وضع التنسيق.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

قيمة الخاصية

TextExtractorOptions.TextFormattingMode

OperationName

يعيد اسم العملية.

public override string OperationName { get; }

قيمة الخاصية

string

 عربي