Class PdfExtractor
Class PdfExtractor
이름 공간 : Aspose.Pdf.Plugins 모임: Aspose.PDF.dll (25.4.0)
PDF 문서의 페이지에서 발생할 수 있는 텍스트, 이미지 및 다른 종류의 콘텐츠를 추출하는 기본 기능을 나타냅니다.
public abstract class PdfExtractor : IPlugin, IDisposable
Inheritance
Derived
ImageExtractor , TextExtractor
Implements
상속 회원들
object.GetType() , object.MemberwiseClone() , object.ToString() , object.Equals(object?) , object.Equals(object?, object?) , object.ReferenceEquals(object?, object?) , object.GetHashCode()
Examples
예제는 PDF 문서에서 텍스트 콘텐츠를 추출하는 방법을 보여줍니다.
// create TextExtractor object to extract PDF contents
using (TextExtractor extractor = new TextExtractor())
{
// create TextExtractorOptions object to set instructions
textExtractorOptions = new TextExtractorOptions();
// add input file path to data sources
textExtractorOptions.AddInput(new FileDataSource(inputPath));
// perform extraction process
ResultContainer resultContainer = extractor.Process(textExtractorOptions);
// get the extracted text from the ResultContainer object
string textExtracted = resultContainer.ResultCollection[0].ToString();
}
Remarks
Aspose.Pdf.Plugins.TextExtractor 개체는 텍스트를 추출하거나 Aspose.Pdf.Plugins.ImageExtractor 이미지를 추출하는 데 사용됩니다.
Constructors
PdfExtractor()
protected PdfExtractor()
Methods
Dispose()
실행 IDisposable. 사실, 그것은 PdfExtractor에 필요하지 않습니다.
public void Dispose()
Process(IPlugin옵션)
PdfExtractor 처리를 지정된 매개 변수로 시작합니다.
public ResultContainer Process(IPluginOptions pdfExtractorOptions)
Parameters
pdfExtractorOptions
IPluginOptions
PdfExtractor에 대한 지침을 포함하는 옵션 개체.
Returns
추출 결과를 포함하는 ResultContainer 개체.