Wyszukiwanie
Wyszukiwanie zwraca dopasowane karty wiedzy uszeregowane według trafności. Bez LLM — czyste wyszukiwanie wektorowe z opcjonalnym rerankingiem.Parametry
| Parametr | Typ | Domyślnie | Opis |
|---|---|---|---|
query | string | wymagany | Zapytanie wyszukiwania |
top_k | integer | 10 | Liczba wyników (1-100) |
rerank | boolean | true | Zastosuj reranking cross-encoderem |
current_only | boolean | true | Tylko aktualne wersje dokumentów |
filters | object | null | Filtry metadanych (patrz niżej) |
Filtry
Zawęź wyniki po metadanych:| Filtr | Opis |
|---|---|
knowledge_type | Typ karty (np. knowledge, procedure, reference) |
document_id | Ogranicz do kart z konkretnego dokumentu |
Pytania
Zadaj pytanie i otrzymaj odpowiedź AI opartą na Twojej bazie wiedzy.Parametry
| Parametr | Typ | Domyślnie | Opis |
|---|---|---|---|
question | string | wymagany | Twoje pytanie |
model | string | auto | Model LLM do użycia |
mode | string | "full" | "fast" (szukaj → LLM) lub "full" (pipeline z eskalacją agenta) |
stream | boolean | false | Streamuj odpowiedź jako zdarzenia SSE |
top_k | integer | 10 | Liczba kart wiedzy do pobrania |
current_only | boolean | true | Tylko aktualne wersje dokumentów |
chat_history | array | [] | Poprzednie tury rozmowy |
filters | object | null | Te same filtry co w wyszukiwaniu |
Tryby
fast — Pobiera karty, wysyła do LLM, zwraca odpowiedź. Deterministyczny i szybki. Filtry i current_only w pełni obsługiwane.
full — Używa pełnego pipeline z inteligentnym routingiem i eskalacją do agenta. Może trwać dłużej, ale lepiej radzi sobie ze złożonymi pytaniami. Uwaga: filters i current_only nie są obsługiwane w trybie full.
Odpowiedź
Streaming
Ustawstream: true aby otrzymywać zdarzenia Server-Sent Events:
| Zdarzenie | Opis |
|---|---|
status | Aktualizacja statusu przetwarzania |
answer_chunk | Fragment odpowiedzi (streamuj w miarę nadchodzenia) |
source | Karta wiedzy użyta do odpowiedzi |
done | Stream zakończony, zawiera zużycie tokenów i info o modelu |
Rozmowy wieloturowe
Przekaż poprzednie tury wchat_history dla pytań uzupełniających:
[pytanie, odpowiedź].