secretmag.ru
Энциклопедия6 мин.

Что такое промпт-инжиниринг и почему это профессия будущего. Простыми словами

© Коллаж: «Секрет фирмы», vector_corp/freepik

Промпт-инжиниринг — это процесс создания и последующей оптимизации промптов, то есть запросов и задач для генеративных моделей (нейросетей). Правильно составленный промпт помогает получить более точный и близкий к желаемому результат, поэтому искусство их составления сейчас превращается в отдельную дисциплину на стыке логики, математики, программирования и гуманитарных дисциплин.

Простыми словами, промпт — это инструкция, которую пользователь даёт нейросети: нарисовать картинку, сократить текст, составить контент-план и т. д. Запрос надо составить таким образом, чтобы нейросеть дала ответ, максимально соответствующий вашим ожиданиям.


Эксперты статьи

  • Роман Душкин, главный архитектор систем искусственного интеллекта НИЯУ МИФИ
  • Катерина Тихомирова, ведущий эксперт лаборатории цифровых технологий в гуманитарных науках НИЯУ МИФИ

История термина и профессии

Prompt с английского — это подсказка. И промпт-инжиниринг как «техника подсказок» появилась еще до массового распространения GPT — в направлении обработки текстов на естественном языке (Natural Language Processing, NLP).

Вероятно, первыми термин «промптинг» ввели в 2017 году исследователи из Carnegie Mellon University и National University of Singapore, которые создали большие языковые модели, обученные на промптах.

Промптинг развивался как направление при разработке GPT-2, GPT-3 и последующих версий чат-бота. А в 2022 году появились модели машинного обучения DALL-E 2, Stable Diffusion, Midjourney, которые научились использовать текстовые промпты для создания изображений.

Кто такой промпт-инженер, сколько он зарабатывает

Промпт-инженер — специалист по общению с ИИ. Промпт-инженеры помогают языковым моделям быть полезными для людей.

Официально в России этой профессии не существует — для этого должен быть утверждён профессиональный стандарт. А для этого прошло ещё слишком мало времени с тех пор, как эта специальность в принципе стала актуальной.

Тем не менее вакансии промпт-инженера на рекрутинговых сервисах появляются регулярно. В начале ноября 2024 года на одном из ведущих рекрутинговых сайтов в Москве размещены 10 вакансий с названием «промпт-инженер». Зарплаты: в одном месте это сумма от 80 000 рублей, в другом — от 100 000 до 300 000 рублей на руки в месяц.

До сих пор идут споры, нужна ли эта профессия вообще, или это всё-таки не специализация, а всего лишь навык — такой же, как умение работать с текстовыми редакторами и Excel.

Кто такой промпт-инженер по сути? Это человек, который умеет правильно задавать запросы большой языковой модели. Человек, который пару часов пообщался с ИИ, быстро поймёт, на что модель реагирует, и в конце концов научится задавать ей качественные запросы.

Роман Душкин
главный архитектор систем искусственного интеллекта НИЯУ МИФИ

Эксперт добавил, что часто под промпт-инженером подразумевают человека, пытающегося обходить запреты и выявлять тонкости, т. н. tips and tricks, которые можно использовать в промптинге. Но такого специалиста правильнее называть тестировщиком.

Как стать промпт-инженером

Стать промпт-инженером или просто заниматься промпт-инжинирингом в рамках своей профессии может любой. Часто гуманитарное образование называют одним из преимуществ для этой профессии, но в конкретных компаниях может быть запрос и на высшее техническое образование — в зависимости от конкретных задач, под которые нанимают человека.

Сейчас появилось достаточно много курсов, бесплатных и платных, на которых обучают основам промптинга.

Расширить свои компетенции для этой профессии можно, например, за счёт изучения основ программирования на Python: некоторые работодатели, которые уже разместили вакансии промпт-инженеров, указывают это в требованиях.

Компании также надеются на имеющийся опыт работы с искусственным интеллектом, либо тестировщиком, бизнес-аналитиком и т. д.

Области применения промпт-инжиниринга

Промпт-инжиниринг поможет в генерации текста, изображений, анализе данных и программировании с помощью нейросетей.

В коэволюции выиграет тот, кто принимает и понимает принцип действия новых технологий. В сообществе сейчас часто звучит сленговое «кентавр» — так называют тех, кто использует в своей деятельности ИИ-технологии. То есть, кентавр — это врач+ИИ, водитель+ИИ, преподаватель+ИИ.

Катерина Тихомирова
ведущий эксперт лаборатории цифровых технологий в гуманитарных науках НИЯУ МИФИ

В университетах благодаря промпт-инжинирингу можно быстро составлять планы и учебные программы, индивидуальные образовательные и научные траектории. В строительстве этот навык поможет в проектировании; в соцсетях — в создании иллюстраций, контент-плана и т. д. Большие языковые модели применимы в сельском хозяйстве, фармакологии, гейм-дизайне, музыке — где угодно.

Линейный сотрудник, участвующий в процессах обработки информации, должен при получении задачи спрашивать себя: как мне поможет её решить большая языковая модель или агент на её основе? Руководитель должен ставить вопрос: как поставленную передо мной цель достигнуть при помощи больших языковых моделей?

Роман Душкин

Навыкам промпт-инженерии можно обучить вообще всех сотрудников, которые работают с информацией. На основе языковых моделей они могут создать интеллектуальных агентов для решения тех или иных задач.

Например, при подготовке презентаций можно пользоваться для ускорения своей работы ботом-художником и ботом, помогающим создавать структуру и наполнять слайды текстами.

Основные принципы промпт-инжиниринга

Основные принципы промпт-инжиниринга зимой 2023–2024 гг. описали в своей статье на основе работы с нейросетью ChatGPT-4/4o трое исследователей из MBZUAI — университета искусственного интеллекта, базирующегося в Абу-Даби. В тексте 26 принципов, объединённые в пять групп.

1. Структурные принципы.

Здесь исследователи, например, рекомендуют:

  • указывать для нейросети аудиторию, к которой обращён результат (например, «объясни принцип круговорота воды для ученика начальной школы»);
  • давать ИИ начало мысли, которую нужно продолжить;
  • использовать только утвердительные конструкции. С этим, к слову, многие не соглашаются, потому что и с отрицательными директивами нейросети справляются;
  • использовать разделители: «Инструкция», затем «Пример», после этого — «Вопрос».

2. Описание задачи.

В этом разделе мы описываем, что нам нужно и какого результата мы хотим добиться от нейросетки. Исследователи рекомендуют:

  • давать подсказки: «объясни простыми словами», «используй простой язык», «используй тот же стиль, что и в образце»;
  • попросить ИИ проверить, насколько беспристрастен ответ, не опирается ли он на стереотипы.

3. Взаимодействие с пользователем.

Языковую модель можно побудить задавать дополнительные вопросы для того, чтобы она получила достаточно информации для необходимого результата. Используйте фразу: «С этого момента я хотел бы, чтобы ты задавала мне вопросы о задаче».

В конце своего общения с ИИ по одной теме можно подытожить всё сделанное до этого, чтобы сгенерировать подробный ответ со всей необходимой информацией.

4. Стиль общения с ИИ.

Исследователи призывают настойчиво требовать от нейросети результата:

  • пишите «твоя задача», «ты должен». Исследователи даже рекомендуют угрожать и обещать поощрение нейросети, добавляя такие фразы, как «ты будешь оштрафован», или, наоборот, «даю чаевые за лучшее решение»;
  • не надо быть вежливым: слова «пожалуйста», «будьте добры» можно опустить. Впрочем, и на этот счёт есть другие мнения среди исследователей;
  • повторяйте определённые слова или фразы несколько раз.

5. Сложные задачи.

Здесь исследователи призывают разбивать наиболее трудные запросы на последовательность простых.

Ещё один «секрет» — в контекстном прогреве. Сначала — предварительная беседа, small talk c ИИ-ботом на заданную тему, а затем — промпт. Это поможет получить хороший результат.

Катерина Тихомирова

Основные техники промпт-инжиниринга

Главных техник промптинга несколько.

  • Zero-shot prompting

Это самая распространённая техника: обычный вопрос нейросети, на который она ответит в свободной форме, основываясь на общем представлении о предмете.

  • One-shot и Few-shot prompting

One-shot prompting — когда ИИ получил один пример. Few-shot — когда подсказок несколько.

Покажем, как это работает, на простейшей загадке.

Спрашиваем у нейросети: «Цветок — сколько?» ИИ пытается предположить ответ: «Цветок — одно слово». Это zero-shot prompting.

Теперь используем one-shot prompting: «Роза — четыре, цветок — сколько?» ИИ получил подсказку и сообразил: «Если вы имеете в виду количество букв в слове "цветок", то их шесть».

Несколько подсказок дали бы нейросети ещё больше информации для правильного ответа.

  • Chain-of-thought prompting

Это «доспрашивание»: получив первый ответ, мы задаём дополнительные вопросы или даём новые данные. Можно добавлять контекст, роли получателей информации и автора.

Например, моно делать так: сначала поставить задачу, потом добавить контекст и детали, затем дать инструкцию, назначить роль и задать стиль и тон.

  • Self-Consistency

Это техника, когда языковая модель проверяет сама себя. Сначала ИИ генерирует ответ, а затем по просьбе пользователя («Проверь согласованность результатов с исходными данными») пересматривает его на согласованность.

  • Generated Knowledge Prompting

Техника подразумевает, что пользователь, получив недостаточный ответ, самостоятельно насыщает языковую модель необходимыми данными для получения более развёрнутого результата.

Используются и более сложные техники: Tree of Thoughts (дерево мыслей), Prompt Chaining (разбивка задачи на подзадачи) и т. д. С развитием больших языковых моделей методов промптинга становится только больше.