Аноны, заранее прошу прощения, на доску давно не заходил, может, пропустил что-то.
Заметил, что в моей предметной области ChatGPT и DeepSeek обычно выдают полнейшую хуету, поэтому на их фоне сильно выигрывает Perplexity, так как она перед тем, как отвечать, погуглит информацию по теме. У меня возникла мысль, что можно очень сильно повысить эффективность использования языковых моделей, если скормить им тонну документации, гайдов, статей, внутренних документов компании и так далее, чтобы ИИшка была "в контексте".
Либо я ученый и хочу скормить ей пару десятков или даже сотен пдфок со статьями.
Итак, вопрос: как это делать без больших вычислительных ресурсов?
Пока для личного пользования (и без ресурсов на селфхост), нужно какое-то более-менее простое решение в облачке. В перспективе буду селфхостить, если буду делать для всей компании, например, но пока ресурсов нет.
Пока что это ИИ-агенты на платных сервисах где тарифы. Но возможно через пару лет утечёт что-то в открытый доступ и на торрентах начнут как обычные фильмы так и выкладывать разные ИИ, и таких агентов которых можно дообучать самому на своих темах.