# Источники данных

## Добавление источников

После создания базы вы попадаете на страницу источников данных. Поддерживаемые форматы: DOCX, PDF, TXT, XLSX, XLS, CSV, HTML, MARKDOWN, MD, MDX. Максимальный размер файла — 15 МБ, не более 5 файлов за одну загрузку.

Источники добавляются двумя способами:

**Документы** — перетащите файлы в зону загрузки или нажмите на неё, чтобы открыть файловый менеджер.

**Ссылки на сайты** — вставьте URL и нажмите **Обработать**. Доступны два режима:

* **Сайт** — платформа обходит страницу и связанные подстраницы. Можно настроить глубину сканирования и количество подстраниц.
* **Каталог** — специальный режим для страниц со списками однотипных карточек: товаров, объявлений, вакансий или объектов недвижимости. Платформа автоматически обходит страницы каталога и собирает цены, характеристики и другую информацию. Подходит для сайтов с навигацией через кнопку **«Далее»**, номера страниц или прокрутку. Не подходит для обычных страниц сайта.

> Чтобы переключиться между режимами «Сайт» и «Каталог», нужно сначала удалить уже обработанную ссылку в текущем режиме.

Режим **Каталог** предназначен только для страниц с карточками товаров или объявлений. Для обычных страниц сайта — описания услуг, контакты, условия доставки — используйте режим **Сайт**. Выбор правильного режима напрямую влияет на качество обработки данных. Если вам нужно загрузить и каталог, и остальные страницы сайта, добавляйте их отдельными ссылками: сначала каталог в режиме **Каталог**, затем остальные страницы в режиме **Сайт**.

{% hint style="info" %}
Платформа обрабатывает до 50 страниц каталога и не более 4 000 позиций за одну загрузку. Если каталог превышает этот лимит, добавьте ссылки на отдельные категории или разделы, а не на весь каталог целиком — так данные будут обработаны полнее и точнее.
{% endhint %}

<figure><img src="/files/XFIAVNHX2LOC1Esql076" alt=""><figcaption><p><em>Рисунок 19. Добавление источников</em></p></figcaption></figure>

### **Как подготовить агента для ответов по информации с сайта**

{% stepper %}
{% step %}

#### Разделите страницы сайта на два типа

Страницы каталога содержат карточки товаров, услуг или объявлений с названием, описанием и ценой. Если карточка раскрывается и внутри есть подробное описание, платформа обработает его тоже. Все остальные страницы (FAQ, «О нас», режим работы, доставка) — это обычные страницы сайта.
{% endstep %}

{% step %}

#### Страницы каталога добавьте в режиме **Каталог**

Платформа обрабатывает до 50 страниц и не более 4 000 позиций за одну загрузку. Если каталог большой, добавляйте ссылки на отдельные категории.
{% endstep %}

{% step %}

#### Остальные страницы добавьте в режиме **Сайт**

{% endstep %}
{% endstepper %}

## Статусы источников

После загрузки каждый источник проходит обработку. Возможные статусы:

| Статус         | Описание                             |
| -------------- | ------------------------------------ |
| В очереди      | Источник ожидает обработки           |
| Обрабатывается | Идёт индексация содержимого          |
| Включено       | Источник активен и доступен агенту   |
| Отключено      | Источник временно исключён из поиска |
| Ошибка         | Не удалось обработать                |

При ошибке: выберите источник через чекбокс и нажмите **Обработать заново**. Либо воспользуйтесь уведомлением в шапке таблицы — оно появляется автоматически при наличии ошибок.

## Управление источниками

При выборе одного или нескольких источников через чекбоксы появляется нижняя панель с действиями:

* **Включить / Отключить** — изменить доступность источника для агента.
* **Скачать** — загрузить оригинальные файлы в ZIP-архиве.
* **Обработать заново** — повторная индексация источников со статусом «Ошибка».
* **Удалить** — удалить источники из базы знаний.

<figure><img src="/files/WjRdvWN6u7RTi64Y6JFE" alt=""><figcaption><p><em>Рисунок 20. Управление источниками</em></p></figcaption></figure>

## Обновление ссылок

Если содержимое сайта изменилось, не нужно удалять ссылку и добавлять её заново. Нажмите меню действий **(⋯)** рядом со ссылкой в таблице источников и выберите **Обновить данные.**

&#x20;Платформа повторно считает содержимое страницы, сохранив исходный URL и дату добавления. Повторная публикация агента при этом не требуется.

<figure><img src="/files/GNdOjMdYOzTRnHSc6IHb" alt=""><figcaption><p><em>Рисунок 21. Обновление данных по ссылке</em></p></figcaption></figure>

## Работа с базой знаний

Внутри базы знаний доступны дополнительные инструменты:

* **Поиск и фильтрация.** Используйте строку поиска, чтобы найти конкретный документ или ссылку по названию. Фильтр по статусу позволяет быстро найти источники с ошибками или отключённые.
* **Переименование источника.** Наведите на название документа в таблице, и справа появится значок редактирования. Нажмите на него и введите новое название. Это помогает давать источникам понятные имена вместо технических названий файлов.
* **Просмотр фрагментов.** Нажмите на источник, чтобы открыть его содержимое в виде фрагментов, на которые платформа разбила документ. Здесь можно отредактировать текст конкретного фрагмента или отключить его.
* **Удаление базы знаний.** Откройте контекстное меню карточки базы знаний и выберите **Удалить**. Подтвердите действие в модальном окне. Удаление необратимо.


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.evo-ai.ru/rukovodstvo-polzovatelya-evoai/bazy-znanii/istochniki-dannykh.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
