Создание AI базы GPT типа

Создать AI базу GPT типа

Рассмотрим второй способ поиска ответа - поиск среди файлов, на основе которых было произведено обучение.

ПримечаниеОбучение AI баз доступно только при подключении модели ChatGPT от OpenAI либо локальной модели PravoGPT.

Добавить источники

Подумайте, какие вопросы может задать респондент в диалоге.

Например, если мы создаем бота для консультации пользователей, то респондент может спросить:

  1. Как создать бот?
  2. Как добавить блок?
  3. Какие блоки бывают?
  4. Что такое кастомный блок? и т.д.

Добавьте источники, которые могут ответить на эти вопросы.

  1. Выберите нужную базу.
  2. Нажмите кнопку .
  3. Выберите тип добавляемого источника - Файл или Ссылка.
  4. Для ссылки укажите уровень глубины обучения для добавляемой ссылки - Одна страница или Весь сайт (по завершении обучения в названии источника отобразится количество обработанных страниц).
  5. Нажмите Запустить обучение.

Чтобы переименовать или удалить источник, наведите на его название, нажмите кнопку  и выберите действие.

ПримечаниеВ одной базе может быть не более 20 источников.

Если при обучении базы происходит превышение ограничения на суммарное количество символов в источниках - отображается ошибка с текстом: "Превышено ограничение на количество токенов в одной базе".

Добавление источника типа Файл

Ограничения для источника типа Файл:

  1. Файлы должны быть формата: PDF, HTML, DOC, DOCX, TXT, CSV, XLSX, XLS, PPT, PPTX.
  2. При загрузке файлов не работает Drag-and-drop.
  3. Размер каждого файла не должен превышать 10 Мб.
ПримечаниеЕсли для загрузки был выбран файл несовместимого формата - отображается ошибка с текстом: "Файл должен быть в формате: PDF, HTML, TXT, CSV, DOC, DOCX, XLSX, XLS, PPT, PPTX".

Добавление источника типа Ссылка

Ограничения для источника типа Ссылка:

  1. При значении параметра Глубина, равном Весь сайт, система не может выходить за рамки домена и пути страницы.
  2. Не могут быть обработаны ссылки, требующие ввода данных для прохождения авторизации или CAPTCHA.
  3. Для инстанса может быть установлено ограничение на максимальное количество страниц на добавление в базу знаний при обработке всего сайта (увидеть его вы можете при выборе значения Весь сайт).

Например, при добавлении ссылки https://help.bot.one/category/release_notes/ с выбранным значением Весь сайт параметра Глубина:

  1. Не может добавить в базу страницы https://www.google.com/ или https://help.bot.one/category/usage/bots/add_block/;
  2. Может добавить в базу страницу https://help.bot.one/category/release_notes/2024/.

Добавление источника типа Диалоги из бота

Если тип источника - Диалоги из бота: для обучения базы используются только текстовые сообщения оператора и респондента из диалога бота. После завершения обучения доступно скачивание файла с диалогами бота в формате txt,где содержимое сортируется в хронологическом порядке:

  1. Диалоги - по дате и времени создания диалога (сверху старые);
  2. Внутри диалога - по дате и времени отправки сообщения (сверху старые).

Если используемый в качестве источника бот был удален после обучения базы, то диалоги с ним учитываются при ответе GPT, пока база не будет переобучена.

Дополнение такого источника новыми данными из диалогов происходит при одном из условий:

  1. При переобучении всей базы нажатием на Запустить обучение;
  2. При автоматическом переобучении базы.

Запустить обучение

После добавления источников необходимо запустить процесс обучения. Для этого нажмите Запустить обучение.

Статус источника может принимать значение:

  • Не обработано - источник еще не участвовал в обучении;
  • Идет обучение - в текущий момент источник участвует в обучении;
  • Не удалось обработать - произошла ошибка при обработке источника;
  • Обучение завершено - обучение прошло успешно, источник обработан без ошибок.

Статус базы может принимать значение:

  • Обучение не пройдено - обучение не было начато или в процессе обучения возникла ошибка при обработке всех источников;
  • Идет обучение - продолжается обучение, происходит обработка источников;
  • Обучение завершено частично - в процессе обучения возникла ошибка при обработке некоторых источников;
  • Обучение завершено - обучение прошло успешно, все источники обработаны без ошибок.

При достижении лимита на количество запросов к GPT обучение недоступно.

Переобучение AI базы GPT типа

Если в AI базу GPT типа были добавлены новые источники, либо произошли изменения в ранее добавленных источниках -вы можете переобучить базу:

  1. Вручную, с помощью нажатия на Запустить обучение;
  2. С помощью периодического Автоматического переобучения (при выбранном логическом параметре Использовать автообучение в настройках AI базы). Если на инстансе включена возможность автоматического переобучения - в базе указывается дата следующего переобучения (если база не имеет статус Training in Progress и обучение для базы запускалось вручную хотя бы один раз).