Рассмотрим второй способ поиска ответа - поиск среди файлов, на основе которых было произведено обучение.
Примечание
Обучение AI баз доступно только при включенной на инстансе интеграции с GPT.
Добавить источники
Подумайте, какие вопросы может задать респондент в диалоге.
Например, если мы создаем бота для консультации пользователей, то респондент может спросить:
Как создать бот?
Как добавить блок?
Какие блоки бывают?
Что такое кастомный блок? и т.д.
Добавьте источники, которые могут ответить на эти вопросы.
Выберите нужную базу.
Нажмите кнопку .
Выберите тип добавляемого источника - Файл или Ссылка.
Для ссылки укажите уровень глубины обучения для добавляемой ссылки - Одна страница или Весь сайт (по завершении обучения в названии источника отобразится количество обработанных страниц).
Нажмите Запустить обучение.
Чтобы переименовать или удалить источник, наведите на его название, нажмите кнопку и выберите действие.
Примечание
В одной базе может быть не более 20 источников.
Если при обучении базы происходит превышение ограничения на суммарное количество символов в источниках - отображается ошибка с текстом: "Превышено ограничение на количество токенов в одной базе".
Добавление источника типа Файл
Ограничения для источника типа Файл:
Файлы должны быть формата: PDF, HTML, DOC, DOCX, TXT, CSV, XLSX, XLS, PPT, PPTX.
При загрузке файлов не работает Drag-and-drop.
Размер каждого файла не должен превышать 10 Мб.
Примечание
Если для загрузки был выбран файл несовместимого формата - отображается ошибка с текстом: "Файл должен быть в формате: PDF, HTML, TXT, CSV, DOC, DOCX, XLSX, XLS, PPT, PPTX".
Добавление источника типа Ссылка
Ограничения для источника типа Ссылка:
При значении параметра Глубина, равном Весь сайт, система не может выходить за рамки домена и пути страницы.
Не могут быть обработаны ссылки, требующие ввода данных для прохождения авторизации или CAPTCHA.
Для инстанса может быть установлено ограничение на максимальное количество страниц на добавление в базу знаний при обработке всего сайта (увидеть его вы можете при выборе значения Весь сайт).
Если тип источника - Диалоги из бота: для обучения базы используются только текстовые сообщения оператора и респондента из диалога бота. После завершения обучения доступно скачивание файла с диалогами бота в формате txt,где содержимое сортируется в хронологическом порядке:
Диалоги - по дате и времени создания диалога (сверху старые);
Внутри диалога - по дате и времени отправки сообщения (сверху старые).
Если используемый в качестве источника бот был удален после обучения базы, то диалоги с ним учитываются при ответе GPT, пока база не будет переобучена.
Дополнение такого источника новыми данными из диалогов происходит при одном из условий:
При переобучении всей базы нажатием на Запустить обучение;
При автоматическом переобучении базы.
Запустить обучение
После добавления источников необходимо запустить процесс обучения. Для этого нажмите Запустить обучение.
Статус источника может принимать значение:
Не обработано - источник еще не участвовал в обучении;
Идет обучение - в текущий момент источник участвует в обучении;
Не удалось обработать - произошла ошибка при обработке источника;
Обучение завершено - обучение прошло успешно, источник обработан без ошибок.
Статус базы может принимать значение:
Обучение не пройдено - обучение не было начато или в процессе обучения возникла ошибка при обработке всех источников;
Идет обучение - продолжается обучение, происходит обработка источников;
Обучение завершено частично - в процессе обучения возникла ошибка при обработке некоторых источников;
Обучение завершено - обучение прошло успешно, все источники обработаны без ошибок.
Переобучение AI базы GPT типа
Если в AI базу GPT типа были добавлены новые источники, либо произошли изменения в ранее добавленных источниках -вы можете переобучить базу:
Вручную, с помощью нажатия на Запуститьобучение;
С помощью периодического Автоматического переобучения (по умолчанию отключено, для включения обратитесь в техническую поддержку). Если на инстансе включена возможность автоматического переобучения - в базе указывается дата следующего переобучения (если база не имеет статус Training in Progress и обучение для базы запускалось вручную хотя бы один раз).