Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

Mewakili opsi ekstraksi teks untuk plugin TextExtractor.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

Pewarisan

objectPdfExtractorOptionsTextExtractorOptions

Mengimplementasikan

IPluginOptions

Anggota yang Dwarisi

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

Contoh

Contoh ini menunjukkan cara mengekstrak konten teks dari dokumen PDF.

// buat objek TextExtractor untuk mengekstrak konten PDF
using (TextExtractor extractor = new TextExtractor())
{
    // buat objek TextExtractorOptions untuk mengatur TextFormattingMode (Pure, atau Raw - default)
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // tambahkan jalur file input ke sumber data
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // lakukan proses ekstraksi
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // ambil teks yang diekstrak dari objek ResultContainer
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

Catatan

Objek Aspose.Pdf.Plugins.TextExtractorOptions digunakan untuk mengatur Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode dan opsi lainnya untuk operasi ekstraksi teks. Selain itu, ia mewarisi fungsi untuk menambahkan data (file, aliran) yang mewakili dokumen PDF input.

Konstruktor

TextExtractorOptions(TextFormattingMode)

Menginisialisasi instance baru dari objek Aspose.Pdf.Plugins.TextExtractorOptions untuk mode format teks yang ditentukan.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

Parameter

formattingMode TextExtractorOptions.TextFormattingMode

Nilai mode format teks.

TextExtractorOptions()

Menginisialisasi instance baru dari objek Aspose.Pdf.Plugins.TextExtractorOptions dengan mode format teks ‘Raw’ (default).

public TextExtractorOptions()

Properti

FormattingMode

Mengambil mode format.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

Nilai Properti

TextExtractorOptions.TextFormattingMode

OperationName

Mengembalikan nama operasi.

public override string OperationName { get; }

Nilai Properti

string

 Indonesia