added scrapeOptions to extract (#1133)

2025-07-31 01:22:01 +08:00 · 2025-02-07 13:38:08 -03:00 · 2025-02-07 13:38:08 -03:00 · ac5c88bffb
commit ac5c88bffb
parent 42f4f7ef09
3 changed files with 35 additions and 0 deletions
--- a/apps/api/src/tests/e2e_extract/index.test.ts
+++ b/apps/api/src/tests/e2e_extract/index.test.ts
@ -306,4 +306,35 @@ describe("E2E Tests for Extract API Routes", () => {
    },
    60000,
  );
+
+  it.concurrent(
+    "should extract information with scrapeOptions.waitFor",
+    async () => {
+      const response = await request(TEST_URL)
+        .post("/v1/extract")
+        .set("Authorization", `Bearer ${process.env.TEST_API_KEY}`)
+        .set("Content-Type", "application/json")
+        .send({
+          urls: ["https://firecrawl-e2e-test-git-main-rafaelsideguides-projects.vercel.app/"],
+          prompt: "What is the content right after the #content-1 id?",
+          schema: {
+            type: "object",
+            properties: {
+              content: { type: "string" },
+            },
+            required: ["content"],
+          },
+          scrapeOptions: {
+            waitFor: 6000,
+          }
+        });
+
+      expect(response.statusCode).toBe(200);
+      expect(response.body).toHaveProperty("data");
+      expect(typeof response.body.data).toBe("object");
+      expect(response.body.data?.content).toBeDefined();
+      expect(response.body.data?.content).toBe("Content loaded after 5 seconds!");
+    },
+    60000,
+  );
 });
--- a/apps/api/src/controllers/v1/types.ts
+++ b/apps/api/src/controllers/v1/types.ts
@ -226,6 +226,7 @@ export const extractV1Options = z
    includeSubdomains: z.boolean().default(true),
    allowExternalLinks: z.boolean().default(false),
    enableWebSearch: z.boolean().default(false),
+    scrapeOptions: scrapeOptions.default({ onlyMainContent: false }).optional(),
    origin: z.string().optional().default("api"),
    urlTrace: z.boolean().default(false),
    timeout: z.number().int().positive().finite().safe().default(60000),
--- a/apps/api/src/lib/extract/extraction-service.ts
+++ b/apps/api/src/lib/extract/extraction-service.ts
@ -294,6 +294,8 @@ export async function performExtraction(
            isMultiEntity: true,
          }),
          {
+            ...request.scrapeOptions,
+
            // Needs to be true for multi-entity to work properly
            onlyMainContent: true,
          }
@ -554,6 +556,7 @@ export async function performExtraction(
            url,
            isMultiEntity: false,
          }),
+          request.scrapeOptions
        );
      }
      return docsMap.get(normalizeUrl(url));