Class TextExtractorOptions

Class TextExtractorOptions

Namespace: Aspose.Pdf.Plugins
Assembly: Aspose.PDF.dll

텍스트 추출 옵션을 나타내는 TextExtractor 플러그인입니다.

public sealed class TextExtractorOptions : PdfExtractorOptions, IPluginOptions

상속

objectPdfExtractorOptionsTextExtractorOptions

구현

IPluginOptions

상속된 멤버

PdfExtractorOptions.AddInput(IDataSource), PdfExtractorOptions.Inputs, PdfExtractorOptions.OperationName, object.GetType(), object.ToString(), object.Equals(object?), object.Equals(object?, object?), object.ReferenceEquals(object?, object?), object.GetHashCode()

예제

이 예제는 PDF 문서의 텍스트 내용을 추출하는 방법을 보여줍니다.

// PDF 내용을 추출하기 위해 TextExtractor 객체 생성
using (TextExtractor extractor = new TextExtractor())
{
    // TextFormattingMode (Pure 또는 Raw - 기본값)를 설정하기 위해 TextExtractorOptions 객체 생성
    extractorOptions = new TextExtractorOptions(TextExtractorOptions.TextFormattingMode.Pure);

    // 데이터 소스에 입력 파일 경로 추가
    extractorOptions.AddInput(new FileDataSource(inputPath));

    // 추출 프로세스 수행
    ResultContainer resultContainer = extractor.Process(extractorOptions);

    // ResultContainer 객체에서 추출된 텍스트 가져오기
    string textExtracted = resultContainer.ResultCollection[0].ToString();
}

비고

Aspose.Pdf.Plugins.TextExtractorOptions 객체는 Aspose.Pdf.Plugins.TextExtractorOptions.TextFormattingMode 및 텍스트 추출 작업을 위한 기타 옵션을 설정하는 데 사용됩니다. 또한 입력 PDF 문서를 나타내는 데이터(파일, 스트림)를 추가하는 기능을 상속합니다.

생성자

TextExtractorOptions(TextFormattingMode)

지정된 텍스트 형식 모드에 대한 Aspose.Pdf.Plugins.TextExtractorOptions 객체의 새 인스턴스를 초기화합니다.

public TextExtractorOptions(TextExtractorOptions.TextFormattingMode formattingMode)

매개변수

formattingMode TextExtractorOptions.TextFormattingMode

텍스트 형식 모드 값입니다.

TextExtractorOptions()

‘Raw’ (기본값) 텍스트 형식 모드로 Aspose.Pdf.Plugins.TextExtractorOptions 객체의 새 인스턴스를 초기화합니다.

public TextExtractorOptions()

속성

FormattingMode

형식 모드를 가져옵니다.

public TextExtractorOptions.TextFormattingMode FormattingMode { get; }

속성 값

TextExtractorOptions.TextFormattingMode

OperationName

작업의 이름을 반환합니다.

public override string OperationName { get; }

속성 값

string

 한국어