Создание AI базы GPT типа

Создать AI базу типа GPT

Рассмотрим второй способ поиска ответа - поиск среди файлов, на основе которых было произведено обучение.

ПримечаниеОбучение AI баз доступно только при включенной на инстансе интеграции с GPT.

Добавить источники

Подумайте, какие вопросы может задать респондент в диалоге.

Например, если мы создаем бота для консультации пользователей, то респондент может спросить:

  1. Как создать бот?
  2. Как добавить блок?
  3. Какие блоки бывают?
  4. Что такое кастомный блок? и т.д.

Добавьте источники, которые могут ответить на эти вопросы.

  1. Выберите нужную базу.
  2. Нажмите кнопку .
  3. Выберите тип добавляемого источника - Файл или Ссылка.
  4. Для ссылки укажите уровень глубины обучения для добавляемой ссылки - Одна страница или Весь сайт (по завершении обучения в названии источника отобразится количество обработанных страниц).
  5. Нажмите Запустить обучение.

Чтобы переименовать или удалить источник, наведите на его название, нажмите кнопку  и выберите действие.

ПримечаниеВ одной базе может быть не более 20 источников.

Если при обучении базы происходит превышение ограничения на суммарное количество символов в источниках - отображается ошибка с текстом: "Превышено ограничение на количество токенов в одной базе".

Добавление источника типа Файл

Ограничения для источника типа Файл:

  1. Файлы должны быть формата: PDF, HTML, DOC, DOCX, TXT, CSV, XLSX, XLS, PPT, PPTX.
  2. При загрузке файлов не работает Drag-and-drop.
  3. Размер каждого файла не должен превышать 10 Мб.
ПримечаниеЕсли для загрузки был выбран файл несовместимого формата - отображается ошибка с текстом: "Файл должен быть в формате: PDF, HTML, TXT, CSV, DOC, DOCX, XLSX, XLS, PPT, PPTX".

Добавление источника типа Ссылка

Ограничения для источника типа Ссылка:

  1. При значении параметра Глубина, равном Весь сайт, система не может выходить за рамки домена и пути страницы.
  2. Не могут быть обработаны ссылки, требующие ввода данных для прохождения авторизации или CAPTCHA.
  3. Для инстанса может быть установлено ограничение на максимальное количество страниц на добавление в базу знаний при обработке всего сайта (увидеть его вы можете при выборе значения Весь сайт).

Например, при добавлении ссылки https://help.bot.one/category/release_notes/ с выбранным значением Весь сайт параметра Глубина:

  1. Не может добавить в базу страницы https://www.google.com/ или https://help.bot.one/category/usage/bots/add_block/;
  2. Может добавить в базу страницу https://help.bot.one/category/release_notes/2024/.

Добавление источника типа Диалоги из бота

Если тип источника - Диалоги из бота: для обучения базы используются только текстовые сообщения оператора и респондента из диалога бота. После завершения обучения доступно скачивание файла с диалогами бота в формате txt,где содержимое сортируется в хронологическом порядке:

  1. Диалоги - по дате и времени создания диалога (сверху старые);
  2. Внутри диалога - по дате и времени отправки сообщения (сверху старые).

Если используемый в качестве источника бот был удален после обучения базы, то диалоги с ним учитываются при ответе GPT, пока база не будет переобучена.

Дополнение такого источника новыми данными из диалогов происходит при одном из условий:

  1. При переобучении всей базы нажатием на Запустить обучение;
  2. При автоматическом переобучении базы.

Запустить обучение

После добавления источников необходимо запустить процесс обучения. Для этого нажмите Запустить обучение.

Статус источника может принимать значение:

  • Не обработано - источник еще не участвовал в обучении;
  • Идет обучение - в текущий момент источник участвует в обучении;
  • Не удалось обработать - произошла ошибка при обработке источника;
  • Обучение завершено - обучение прошло успешно, источник обработан без ошибок.

Статус базы может принимать значение:

  • Обучение не пройдено - обучение не было начато или в процессе обучения возникла ошибка при обработке всех источников;
  • Идет обучение - продолжается обучение, происходит обработка источников;
  • Обучение завершено частично - в процессе обучения возникла ошибка при обработке некоторых источников;
  • Обучение завершено - обучение прошло успешно, все источники обработаны без ошибок.

При достижении лимита на количество запросов к GPT обучение недоступно.

Переобучение AI базы GPT типа

Если в AI базу GPT типа были добавлены новые источники, либо произошли изменения в ранее добавленных источниках -вы можете переобучить базу:

  1. Вручную, с помощью нажатия на Запустить обучение;
  2. С помощью периодического Автоматического переобучения (по умолчанию отключено, для включения обратитесь в техническую поддержку). Если на инстансе включена возможность автоматического переобучения - в базе указывается дата следующего переобучения (если база не имеет статус Training in Progress и обучение для базы запускалось вручную хотя бы один раз).