Class PdfExtractor
Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll
Mewakili fungsionalitas dasar untuk mengekstrak teks, gambar, dan jenis konten lain yang mungkin muncul di halaman dokumen PDF.
public abstract class PdfExtractor : IPlugin, IDisposable
Pewarisan
Turunan
Mengimplementasikan
Anggota yang diwarisi
object.GetType(), object.MemberwiseClone(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()
Contoh
Contoh ini menunjukkan cara mengekstrak konten teks dari dokumen PDF.
// buat objek TextExtractor untuk mengekstrak konten PDF
using (TextExtractor extractor = new TextExtractor())
{
// buat objek TextExtractorOptions untuk mengatur instruksi
textExtractorOptions = new TextExtractorOptions();
// tambahkan jalur file input ke sumber data
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// lakukan proses ekstraksi
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// ambil teks yang diekstrak dari objek ResultContainer
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Catatan
Objek Aspose.Pdf.Plugins.TextExtractor digunakan untuk mengekstrak teks, atau Aspose.Pdf.Plugins.ImageExtractor untuk mengekstrak gambar.
Konstruktor
PdfExtractor()
protected PdfExtractor()
Metode
Dispose()
Implementasi dari IDisposable. Sebenarnya, tidak diperlukan untuk PdfExtractor.
public void Dispose()
Process(IPluginOptions)
Memulai proses PdfExtractor dengan parameter yang ditentukan.
public ResultContainer Process(IPluginOptions pdfExtractorOptions)
Parameter
pdfExtractorOptions
IPluginOptions
Sebuah objek opsi yang berisi instruksi untuk PdfExtractor.
Mengembalikan
Sebuah objek ResultContainer yang berisi hasil dari ekstraksi.