Class ExtractPDFJob

A job that extracts PDF elements such as text, images, tables in a structured format from a PDF.

Example

Sample Usage:

        const readStream = fs.createReadStream("<SOURCE_PATH>");

        const credentials = new ServicePrincipalCredentials({
            clientId: process.env.PDF_SERVICES_CLIENT_ID,
            clientSecret: process.env.PDF_SERVICES_CLIENT_SECRET
        });

        const pdfServices = new PDFServices({credentials});

        const inputAsset = await pdfServices.upload({
            readStream,
            mimeType: MimeType.PDF
        });

        const params = new ExtractPDFParams({
            elementsToExtract: [ExtractElementType.TEXT]
        });

        const job = new ExtractPDFJob({inputAsset, params});

        const pollingURL = await pdfServices.submit({job});

        const pdfServicesResponse = await pdfServices.getJobResult({
            pollingURL,
            resultType: ExtractPDFResult
        });

        const resultAsset = pdfServicesResponse.result.resource;
        const streamAsset = await pdfServices.getContent({asset: resultAsset});

Hierarchy (view full)

PDFServicesJob
- ExtractPDFJob

Index

Constructors

constructor

new ExtractPDFJob(params): ExtractPDFJob
Constructs a new ExtractPDFJob instance.
Parameters
- params: {
      inputAsset: Asset;
      outputAsset?: Asset;
      params?: ExtractPDFParams;
  }
  The parameters for constructing an instance of ExtractPDFJob.
  - inputAsset: Asset
    The input asset for the job. Cannot be undefined.
  - Optional outputAsset?: Asset
    Asset object representing the output asset.
  - Optional params?: ExtractPDFParams
    ExtractPDFParams object to specify the elements to extract.
Returns ExtractPDFJob
Overrides PDFServicesJob.constructor
- Defined in src/pdfjobs/jobs/ExtractPDFJob.ts:79

Properties

`Private` `Optional` `Readonly` _extractPDFParams

_extractPDFParams?: ExtractPDFParams

`Private` `Readonly` _inputAsset

_inputAsset: Asset

`Private` `Optional` `Readonly` _outputAsset

_outputAsset?: Asset

Methods

`Private` generatePDFServicesAPIRequest

generatePDFServicesAPIRequest(notifierConfigList?): PDFServicesApiRequest
Parameters
- Optional notifierConfigList: NotifierConfig[]
Returns PDFServicesApiRequest
- Defined in src/pdfjobs/jobs/ExtractPDFJob.ts:103

`Protected` validate

validate(executionContext): void
Parameters
- executionContext: ExecutionContext
Returns void
Inherited from PDFServicesJob.validate
- Defined in src/pdfjobs/jobs/PDFServicesJob.ts:22

Class ExtractPDFJob

Example

Hierarchy (view full)

Index

Constructors

Properties

Methods

Constructors

constructor

Parameters

inputAsset: Asset

`Optional` outputAsset?: Asset

`Optional` params?: ExtractPDFParams

Returns ExtractPDFJob

Properties

`Private` `Optional` `Readonly` _extractPDFParams

`Private` `Readonly` _inputAsset

`Private` `Optional` `Readonly` _outputAsset

Methods

`Private` generatePDFServicesAPIRequest

Parameters

Returns PDFServicesApiRequest

`Protected` validate

Parameters

Returns void

Settings

Member Visibility

Theme

On This Page

Class ExtractPDFJob

Example

Hierarchy (view full)

Index

Constructors

Properties

Methods

Constructors

constructor

Parameters

inputAsset: Asset

Optional outputAsset?: Asset

Optional params?: ExtractPDFParams

Returns ExtractPDFJob

Properties

Private Optional Readonly _extractPDFParams

Private Readonly _inputAsset

Private Optional Readonly _outputAsset

Methods

Private generatePDFServicesAPIRequest

Parameters

Returns PDFServicesApiRequest

Protected validate

Parameters

Returns void

Settings

Member Visibility

Theme

On This Page

`Optional` outputAsset?: Asset

`Optional` params?: ExtractPDFParams

`Private` `Optional` `Readonly` _extractPDFParams

`Private` `Readonly` _inputAsset

`Private` `Optional` `Readonly` _outputAsset

`Private` generatePDFServicesAPIRequest

`Protected` validate