Przejdź do głównej treści

Wyszukiwanie

Wyszukiwanie zwraca dopasowane karty wiedzy uszeregowane według trafności. Bez LLM — czyste wyszukiwanie wektorowe z opcjonalnym rerankingiem.
curl -X POST https://aigmented.io/api/v1/collections/49/search \
  -H "Authorization: Bearer sk-TWOJ_KLUCZ_API" \
  -H "Content-Type: application/json" \
  -d '{
    "query": "warunki płatności",
    "top_k": 5,
    "rerank": true
  }'

Parametry

ParametrTypDomyślnieOpis
querystringwymaganyZapytanie wyszukiwania
top_kinteger10Liczba wyników (1-100)
rerankbooleantrueZastosuj reranking cross-encoderem
current_onlybooleantrueTylko aktualne wersje dokumentów
filtersobjectnullFiltry metadanych (patrz niżej)

Filtry

Zawęź wyniki po metadanych:
{
  "query": "warunki płatności",
  "filters": {
    "knowledge_type": "procedure",
    "document_id": "umowa-2024.pdf"
  }
}
FiltrOpis
knowledge_typeTyp karty (np. knowledge, procedure, reference)
document_idOgranicz do kart z konkretnego dokumentu

Pytania

Zadaj pytanie i otrzymaj odpowiedź AI opartą na Twojej bazie wiedzy.
curl -X POST https://aigmented.io/api/v1/collections/49/ask \
  -H "Authorization: Bearer sk-TWOJ_KLUCZ_API" \
  -H "Content-Type: application/json" \
  -d '{
    "question": "Jakie są warunki płatności?",
    "mode": "fast"
  }'

Parametry

ParametrTypDomyślnieOpis
questionstringwymaganyTwoje pytanie
modelstringautoModel LLM do użycia
modestring"full""fast" (szukaj → LLM) lub "full" (pipeline z eskalacją agenta)
streambooleanfalseStreamuj odpowiedź jako zdarzenia SSE
top_kinteger10Liczba kart wiedzy do pobrania
current_onlybooleantrueTylko aktualne wersje dokumentów
chat_historyarray[]Poprzednie tury rozmowy
filtersobjectnullTe same filtry co w wyszukiwaniu

Tryby

fast — Pobiera karty, wysyła do LLM, zwraca odpowiedź. Deterministyczny i szybki. Filtry i current_only w pełni obsługiwane. full — Używa pełnego pipeline z inteligentnym routingiem i eskalacją do agenta. Może trwać dłużej, ale lepiej radzi sobie ze złożonymi pytaniami. Uwaga: filters i current_only nie są obsługiwane w trybie full.

Odpowiedź

{
  "answer": "Warunki płatności stanowią, że...",
  "sources": [
    { "card_id": "abc123", "title": "Sekcja warunków płatności", "score": 0.95 }
  ],
  "model": "google/gemini-3-flash-preview",
  "tokens_used": {
    "llm_prompt": 2100,
    "llm_completion": 350,
    "embedding": 0,
    "model_id": "google/gemini-3-flash-preview"
  }
}

Streaming

Ustaw stream: true aby otrzymywać zdarzenia Server-Sent Events:
curl -N -X POST https://aigmented.io/api/v1/collections/49/ask \
  -H "Authorization: Bearer sk-TWOJ_KLUCZ_API" \
  -H "Content-Type: application/json" \
  -d '{
    "question": "Jakie są warunki płatności?",
    "stream": true
  }'
Zdarzenia:
data: {"type": "status", "data": {"message": "Szukam informacji..."}}

data: {"type": "answer_chunk", "data": {"content": "Warunki płatności"}}

data: {"type": "answer_chunk", "data": {"content": " stanowią, że faktury..."}}

data: {"type": "source", "data": {"card_id": "abc123", "title": "Warunki płatności", "score": 0.95}}

data: {"type": "done", "data": {"total_sources": 3, "model": "google/gemini-3-flash-preview", "tokens": {"prompt_tokens": 2100, "completion_tokens": 350}}}
ZdarzenieOpis
statusAktualizacja statusu przetwarzania
answer_chunkFragment odpowiedzi (streamuj w miarę nadchodzenia)
sourceKarta wiedzy użyta do odpowiedzi
doneStream zakończony, zawiera zużycie tokenów i info o modelu

Rozmowy wieloturowe

Przekaż poprzednie tury w chat_history dla pytań uzupełniających:
{
  "question": "Czy możesz rozwinąć punkt 3?",
  "chat_history": [
    ["Jakie są warunki płatności?", "Warunki płatności stanowią, że..."]
  ]
}
Każdy wpis to para [pytanie, odpowiedź].