TEST: Added test cases for List Dataset HTTP API (#5856)

### What problem does this PR solve? cover dataset list endpoints ### Type of change - [x] Add test cases
2025-07-25 00:34:28 +08:00 · 2025-03-10 18:29:33 +08:00 · 2025-03-10 18:29:33 +08:00 · b18da35da6
commit b18da35da6
parent 8ba1e6c183
1 changed files with 333 additions and 0 deletions
--- a/sdk/python/test/test_http_api/test_dataset_mangement/test_list_dataset.py
+++ b/sdk/python/test/test_http_api/test_dataset_mangement/test_list_dataset.py
@ -0,0 +1,333 @@
+#
+#  Copyright 2025 The InfiniFlow Authors. All Rights Reserved.
+#
+#  Licensed under the Apache License, Version 2.0 (the "License");
+#  you may not use this file except in compliance with the License.
+#  You may obtain a copy of the License at
+#
+#      http://www.apache.org/licenses/LICENSE-2.0
+#
+#  Unless required by applicable law or agreed to in writing, software
+#  distributed under the License is distributed on an "AS IS" BASIS,
+#  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+#  See the License for the specific language governing permissions and
+#  limitations under the License.
+#
+from concurrent.futures import ThreadPoolExecutor
+
+import pytest
+from common import INVALID_API_TOKEN, create_datasets, list_dataset
+from libs.auth import RAGFlowHttpApiAuth
+
+
+def is_sorted(data, field, descending=True):
+    timestamps = [ds[field] for ds in data]
+    return (
+        all(a >= b for a, b in zip(timestamps, timestamps[1:]))
+        if descending
+        else all(a <= b for a, b in zip(timestamps, timestamps[1:]))
+    )
+
+
+class TestAuthorization:
+    @pytest.mark.parametrize(
+        "auth, expected_code, expected_message",
+        [
+            (None, 0, "`Authorization` can't be empty"),
+            (
+                RAGFlowHttpApiAuth(INVALID_API_TOKEN),
+                109,
+                "Authentication error: API key is invalid!",
+            ),
+        ],
+    )
+    def test_invalid_auth(self, auth, expected_code, expected_message):
+        res = list_dataset(auth)
+        assert res["code"] == expected_code
+        assert res["message"] == expected_message
+
+
+class TestDatasetList:
+    def test_default(self, get_http_api_auth):
+        create_datasets(get_http_api_auth, 31)
+        res = list_dataset(get_http_api_auth, params={})
+
+        assert res["code"] == 0
+        assert len(res["data"]) == 30
+
+    @pytest.mark.parametrize(
+        "params, expected_code, expected_page_size, expected_message",
+        [
+            ({"page": None, "page_size": 2}, 0, 2, ""),
+            ({"page": 0, "page_size": 2}, 0, 2, ""),
+            ({"page": 2, "page_size": 2}, 0, 2, ""),
+            ({"page": 3, "page_size": 2}, 0, 1, ""),
+            ({"page": "1", "page_size": 2}, 0, 2, ""),
+            pytest.param(
+                {"page": -1, "page_size": 2}, 100, 0, "1064", marks=pytest.mark.xfail
+            ),
+            pytest.param(
+                {"page": "a", "page_size": 2},
+                100,
+                0,
+                """ValueError("invalid literal for int() with base 10: \'a\'")""",
+                marks=pytest.mark.xfail,
+            ),
+        ],
+    )
+    def test_page(
+        self,
+        get_http_api_auth,
+        params,
+        expected_code,
+        expected_page_size,
+        expected_message,
+    ):
+        create_datasets(get_http_api_auth, 5)
+        res = list_dataset(get_http_api_auth, params=params)
+        assert res["code"] == expected_code
+        if expected_code == 0:
+            assert len(res["data"]) == expected_page_size
+        else:
+            assert res["message"] == expected_message
+
+    @pytest.mark.parametrize(
+        "params, expected_code, expected_page_size, expected_message",
+        [
+            ({"page_size": None}, 0, 30, ""),
+            ({"page_size": 0}, 0, 0, ""),
+            ({"page_size": 1}, 0, 1, ""),
+            ({"page_size": 32}, 0, 31, ""),
+            ({"page_size": "1"}, 0, 1, ""),
+            pytest.param({"page_size": -1}, 100, 0, "1064", marks=pytest.mark.xfail),
+            pytest.param(
+                {"page_size": "a"},
+                100,
+                0,
+                """ValueError("invalid literal for int() with base 10: \'a\'")""",
+                marks=pytest.mark.xfail,
+            ),
+        ],
+    )
+    def test_page_size(
+        self,
+        get_http_api_auth,
+        params,
+        expected_code,
+        expected_page_size,
+        expected_message,
+    ):
+        create_datasets(get_http_api_auth, 31)
+        res = list_dataset(get_http_api_auth, params=params)
+        assert res["code"] == expected_code
+        if expected_code == 0:
+            assert len(res["data"]) == expected_page_size
+        else:
+            assert res["message"] == expected_message
+
+    @pytest.mark.parametrize(
+        "params, expected_code, assertions, expected_message",
+        [
+            (
+                {"orderby": None},
+                0,
+                lambda r: (is_sorted(r["data"], "create_time"), True),
+                "",
+            ),
+            (
+                {"orderby": "create_time"},
+                0,
+                lambda r: (is_sorted(r["data"], "create_time"), True),
+                "",
+            ),
+            (
+                {"orderby": "update_time"},
+                0,
+                lambda r: (is_sorted(r["data"], "update_time"), True),
+                "",
+            ),
+            pytest.param(
+                {"orderby": "a"},
+                100,
+                0,
+                """AttributeError("type object \'Knowledgebase\' has no attribute \'a\'")""",
+                marks=pytest.mark.xfail,
+            ),
+        ],
+    )
+    def test_orderby(
+        self,
+        get_http_api_auth,
+        params,
+        expected_code,
+        assertions,
+        expected_message,
+    ):
+        create_datasets(get_http_api_auth, 3)
+        res = list_dataset(get_http_api_auth, params=params)
+        assert res["code"] == expected_code
+        if expected_code == 0:
+            if callable(assertions):
+                assert all(assertions(res))
+        else:
+            assert res["message"] == expected_message
+
+    @pytest.mark.parametrize(
+        "params, expected_code, assertions, expected_message",
+        [
+            (
+                {"desc": None},
+                0,
+                lambda r: (is_sorted(r["data"], "create_time", True),),
+                "",
+            ),
+            (
+                {"desc": "true"},
+                0,
+                lambda r: (is_sorted(r["data"], "create_time", True),),
+                "",
+            ),
+            (
+                {"desc": "false"},
+                0,
+                lambda r: (is_sorted(r["data"], "create_time", False),),
+                "",
+            ),
+            (
+                {"desc": True},
+                0,
+                lambda r: (is_sorted(r["data"], "create_time", True),),
+                "",
+            ),
+            (
+                {"desc": "false", "orderby": "update_time"},
+                0,
+                lambda r: (is_sorted(r["data"], "update_time", False),),
+                "",
+            ),
+            pytest.param(
+                {"desc": "a"},
+                100,
+                0,
+                """AttributeError("type object \'Knowledgebase\' has no attribute \'a\'")""",
+                marks=pytest.mark.xfail,
+            ),
+        ],
+    )
+    def test_desc(
+        self,
+        get_http_api_auth,
+        params,
+        expected_code,
+        assertions,
+        expected_message,
+    ):
+        create_datasets(get_http_api_auth, 3)
+        res = list_dataset(get_http_api_auth, params=params)
+        # print(res)
+        assert res["code"] == expected_code
+        if expected_code == 0:
+            if callable(assertions):
+                assert all(assertions(res))
+        else:
+            assert res["message"] == expected_message
+
+    @pytest.mark.parametrize(
+        "params, expected_code, expected_num, expected_message",
+        [
+            ({"name": None}, 0, 3, ""),
+            ({"name": "dataset_1"}, 0, 1, ""),
+            ({"name": "a"}, 102, 0, "You don't own the dataset a"),
+        ],
+    )
+    def test_name(
+        self, get_http_api_auth, params, expected_code, expected_num, expected_message
+    ):
+        create_datasets(get_http_api_auth, 3)
+        res = list_dataset(get_http_api_auth, params=params)
+        assert res["code"] == expected_code
+        if expected_code == 0:
+            if params["name"] is None:
+                assert len(res["data"]) == expected_num
+            else:
+                assert res["data"][0]["name"] == params["name"]
+        else:
+            assert res["message"] == expected_message
+
+    @pytest.mark.parametrize(
+        "dataset_id, expected_code, expected_num, expected_message",
+        [
+            (None, 0, 3, ""),
+            (lambda r: r[0], 0, 1, ""),
+            ("a", 102, 0, "You don't own the dataset a"),
+        ],
+    )
+    def test_id(
+        self,
+        get_http_api_auth,
+        dataset_id,
+        expected_code,
+        expected_num,
+        expected_message,
+    ):
+        ids = create_datasets(get_http_api_auth, 3)
+        if callable(dataset_id):
+            params = {"id": dataset_id(ids)}
+        else:
+            params = {"id": dataset_id}
+
+        res = list_dataset(get_http_api_auth, params=params)
+        assert res["code"] == expected_code
+        if expected_code == 0:
+            if params["id"] is None:
+                assert len(res["data"]) == expected_num
+            else:
+                assert res["data"][0]["id"] == params["id"]
+        else:
+            assert res["message"] == expected_message
+
+    @pytest.mark.parametrize(
+        "dataset_id, name, expected_code, expected_num, expected_message",
+        [
+            (lambda r: r[0], "dataset_0", 0, 1, ""),
+            (lambda r: r[0], "dataset_1", 0, 0, ""),
+            (lambda r: r[0], "a", 102, 0, "You don't own the dataset a"),
+            ("a", "dataset_0", 102, 0, "You don't own the dataset a"),
+        ],
+    )
+    def test_name_and_id(
+        self,
+        get_http_api_auth,
+        dataset_id,
+        name,
+        expected_code,
+        expected_num,
+        expected_message,
+    ):
+        ids = create_datasets(get_http_api_auth, 3)
+        if callable(dataset_id):
+            params = {"id": dataset_id(ids), "name": name}
+        else:
+            params = {"id": dataset_id, "name": name}
+
+        res = list_dataset(get_http_api_auth, params=params)
+        if expected_code == 0:
+            assert len(res["data"]) == expected_num
+        else:
+            assert res["message"] == expected_message
+
+    def test_concurrent_list(self, get_http_api_auth):
+        create_datasets(get_http_api_auth, 3)
+
+        with ThreadPoolExecutor(max_workers=5) as executor:
+            futures = [
+                executor.submit(list_dataset, get_http_api_auth) for i in range(100)
+            ]
+        responses = [f.result() for f in futures]
+        assert all(r["code"] == 0 for r in responses)
+
+    def test_invalid_params(self, get_http_api_auth):
+        params = {"a": "b"}
+        res = list_dataset(get_http_api_auth, params=params)
+        assert res["code"] == 0
+        assert len(res["data"]) == 0