[Translation] Что LLM знают о лингвистике? Это зависит от того, какие вопросы им задают

Wunder Fund corporate blog

Artificial Intelligence

Learning languages

Natural Language Processing

Iskusstvennyj intellekt

Bolyshie yazykovye modeli

LLM

Wunder Fund corporate blog

Artificial Intelligence

Learning languages

Natural Language Processing

Искусственный интеллект

Большие языковые модели

LLM

Развитие больших языковых моделей (Large Language Model, LLM) привело к смене парадигмы в сфере обработки естественного языка (Natural Language Processing, NLP). LLM, обученные на огромных объёмах текста, взятого из интернета, могут осваивать выполнение новых задач, задействуя механизмы контекстного обучения. Это означает, что NLP‑специалисты, «натаскивая» такие модели на решение определённых задач, не занимаются обновлением их параметров. Вместо этого специалисты пишут для LLM промпты, демонстрирующие желаемое поведение моделей и содержащие инструкции или некоторое количество готовых примеров. Эти промпты передают моделям в виде входного контекста (потому это и называют «контекстным обучением»), а модели используют информацию из промптов для формирования ответов на похожие вопросы.

Show backup