Развитие больших языковых моделей (Large Language Model, LLM) привело к смене парадигмы в сфере обработки естественного языка (Natural Language Processing, NLP). LLM, обученные на огромных объёмах текста, взятого из интернета, могут осваивать выполнение новых задач, задействуя механизмы контекстного обучения. Это означает, что NLP‑специалисты, «натаскивая» такие модели на решение определённых задач, не занимаются обновлением их параметров. Вместо этого специалисты пишут для LLM промпты, демонстрирующие желаемое поведение моделей и содержащие инструкции или некоторое количество готовых примеров. Эти промпты передают моделям в виде входного контекста (потому это и называют «контекстным обучением»), а модели используют информацию из промптов для формирования ответов на похожие вопросы.
Читать далее[Translation] Что LLM знают о лингвистике? Это зависит от того, какие вопросы им задают
Wunder Fund corporate blog
Artificial Intelligence
Learning languages
Natural Language Processing
Iskusstvennyj intellekt
Bolyshie yazykovye modeli
LLM
Wunder Fund corporate blog
Artificial Intelligence
Learning languages
Natural Language Processing
Искусственный интеллект
Большие языковые модели
LLM