Documentation Index
Fetch the complete documentation index at: https://docs.aigmented.io/llms.txt
Use this file to discover all available pages before exploring further.
Wgraj pliki do kolekcji jednym requestem. Plik jest przechowywany, walidowany i natychmiast kolejkowany do przetwarzania i ekstrakcji wiedzy.
Wgraj plik
curl -X POST https://aigmented.io/api/v1/collections/49/files/upload \
-H "Authorization: Bearer sk-TWOJ_KLUCZ_API" \
-F "file=@/sciezka/do/dokument.pdf"
Odpowiedź:
{
"file_id": 250,
"filename": "dokument.pdf",
"status": "processing",
"content_type": "application/pdf",
"size_bytes": 1048576
}
Plik automatycznie wchodzi do pipeline przetwarzania. Sprawdź status kolekcji, aby wiedzieć kiedy ekstrakcja jest zakończona.
| Format | Rozszerzenia | Typ MIME |
|---|
| PDF | .pdf | application/pdf |
| Excel | .xlsx | application/vnd.openxmlformats-officedocument.spreadsheetml.sheet |
| CSV | .csv | text/csv |
| Word | .docx | application/vnd.openxmlformats-officedocument.wordprocessingml.document |
Walidacja
Pliki są walidowane w trzech warstwach przed uploadem:
- Rozszerzenie — musi być jednym z obsługiwanych formatów powyżej
- Typ MIME — musi odpowiadać oczekiwanemu typowi dla rozszerzenia
- Magic bytes — nagłówek pliku jest sprawdzany aby potwierdzić rzeczywisty format (zapobiega zmianie nazwy plików wykonywalnych na
.pdf)
Pliki wykonywalne (.exe, .sh, .bat, .dll, itd.) i pliki binarne (ELF, Mach-O) są zawsze odrzucane.
Limity
| Limit | Wartość |
|---|
| Maksymalny rozmiar pliku | 50 MB |
| Dozwolone formaty | PDF, XLSX, CSV, DOCX |
Kody błędów
| Status | Znaczenie |
|---|
201 Created | Plik wgrany i przetwarzanie rozpoczęte |
400 Bad Request | Brak pliku (użyj nazwy pola file) |
413 Payload Too Large | Plik przekracza 50 MB |
415 Unsupported Media Type | Format pliku niedozwolony lub niezgodność magic bytes |
Pipeline przetwarzania
Po wgraniu plik przechodzi przez pipeline przetwarzania:
- Parsowanie — dokument jest parsowany na strefy (sekcje, tabele, itd.)
- Ekstrakcja — karty wiedzy są ekstrahowane ze stref za pomocą LLM
- Indeksowanie — karty są embedowane i indeksowane w bazie wektorowej
Pliki referencyjne (.xlsx, .csv) przechodzą osobny pipeline zoptymalizowany dla danych tabelarycznych.
Status kolekcji zmienia się na processing w tym czasie i processed po zakończeniu.