Class TextExtractorOptions
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Mewakili opsi ekstraksi teks untuk plugin TextExtractor.
public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions
Pewarisan
object ← PdfExtractorOptions ← TextExtractorOptions
Mengimplementasikan
Anggota yang Dwarisi
PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Contoh
Contoh ini menunjukkan cara mengekstrak konten teks dari dokumen PDF.
// buat objek TextExtractor untuk mengekstrak konten PDF
using (TextExtractor extractor = new TextExtractor())
{
// buat objek TextExtractorOptions untuk mengatur TextFormattingMode (Pure, atau Raw - default)
extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);
// tambahkan jalur file input ke sumber data
extractorOptions.AddInput(new FileDataSource(inputPath));
// lakukan proses ekstraksi
ResultContainer resultContainer = extractor.Process(extractorOptions);
// ambil teks yang diekstrak dari objek ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Catatan
Objek Aspose.Pdf.Plugins.TextExtractorOptions digunakan untuk mengatur Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode dan opsi lainnya untuk operasi ekstraksi teks. Selain itu, ia mewarisi fungsi untuk menambahkan data (file, aliran) yang mewakili dokumen PDF input.
Konstruktor
TextExtractorOptions(TextFormattingMode)
Menginisialisasi instance baru dari objek Aspose.Pdf.Plugins.TextExtractorOptions untuk mode format teks yang ditentukan.
public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)
Parameter
formattingMode
TextExtractorOptions.TextFormattingMode
Nilai mode format teks.
TextExtractorOptions()
Menginisialisasi instance baru dari objek Aspose.Pdf.Plugins.TextExtractorOptions dengan mode format teks ‘Raw’ (default).
public TextExtractorOptions()
Properti
FormattingMode
Mengambil mode format.
public TextExtractorOptions.TextFormattingMode FormattingMode { get; }
Nilai Properti
TextExtractorOptions.TextFormattingMode
OperationName
Mengembalikan nama operasi.
public override string OperationName { get; }