Что такое промпт-инжиниринг и почему это профессия будущего. Простыми словами
Промпт-инжиниринг — это процесс создания и последующей оптимизации промптов, то есть запросов и задач для генеративных моделей (нейросетей). Правильно составленный промпт помогает получить более точный и близкий к желаемому результат, поэтому искусство их составления сейчас превращается в отдельную дисциплину на стыке логики, математики, программирования и гуманитарных дисциплин.
© Коллаж: «Секрет фирмы», vector_corp/freepik
Простыми словами, промпт — это инструкция, которую пользователь даёт нейросети: нарисовать картинку, сократить текст, составить контент-план и т. д. Запрос надо составить таким образом, чтобы нейросеть дала ответ, максимально соответствующий вашим ожиданиям.
Эксперты статьи
- Роман Душкин, главный архитектор систем искусственного интеллекта НИЯУ МИФИ
- Катерина Тихомирова, ведущий эксперт лаборатории цифровых технологий в гуманитарных науках НИЯУ МИФИ
История термина и профессии
Prompt с английского — это подсказка. И промпт-инжиниринг как «техника подсказок» появилась еще до массового распространения GPT — в направлении обработки текстов на естественном языке (Natural Language Processing, NLP).
Вероятно, первыми термин «промптинг» ввели в 2017 году исследователи из Carnegie Mellon University и National University of Singapore, которые создали большие языковые модели, обученные на промптах.
Промптинг развивался как направление при разработке GPT-2, GPT-3 и последующих версий чат-бота. А в 2022 году появились модели машинного обучения DALL-E 2, Stable Diffusion, Midjourney, которые научились использовать текстовые промпты для создания изображений.
Кто такой промпт-инженер, сколько он зарабатывает
Промпт-инженер — специалист по общению с ИИ. Промпт-инженеры помогают языковым моделям быть полезными для людей.
Официально в России этой профессии не существует — для этого должен быть утверждён профессиональный стандарт. А для этого прошло ещё слишком мало времени с тех пор, как эта специальность в принципе стала актуальной.
Тем не менее вакансии промпт-инженера на рекрутинговых сервисах появляются регулярно. В начале ноября 2024 года на одном из ведущих рекрутинговых сайтов в Москве размещены 10 вакансий с названием «промпт-инженер». Зарплаты: в одном месте это сумма от 80 000 рублей, в другом — от 100 000 до 300 000 рублей на руки в месяц.
До сих пор идут споры, нужна ли эта профессия вообще, или это всё-таки не специализация, а всего лишь навык — такой же, как умение работать с текстовыми редакторами и Excel.
Кто такой промпт-инженер по сути? Это человек, который умеет правильно задавать запросы большой языковой модели. Человек, который пару часов пообщался с ИИ, быстро поймёт, на что модель реагирует, и в конце концов научится задавать ей качественные запросы.
Эксперт добавил, что часто под промпт-инженером подразумевают человека, пытающегося обходить запреты и выявлять тонкости, т. н. tips and tricks, которые можно использовать в промптинге. Но такого специалиста правильнее называть тестировщиком.
Как стать промпт-инженером
Стать промпт-инженером или просто заниматься промпт-инжинирингом в рамках своей профессии может любой. Часто гуманитарное образование называют одним из преимуществ для этой профессии, но в конкретных компаниях может быть запрос и на высшее техническое образование — в зависимости от конкретных задач, под которые нанимают человека.
Сейчас появилось достаточно много курсов, бесплатных и платных, на которых обучают основам промптинга.
Расширить свои компетенции для этой профессии можно, например, за счёт изучения основ программирования на Python: некоторые работодатели, которые уже разместили вакансии промпт-инженеров, указывают это в требованиях.
Компании также надеются на имеющийся опыт работы с искусственным интеллектом, либо тестировщиком, бизнес-аналитиком и т. д.
Области применения промпт-инжиниринга
Промпт-инжиниринг поможет в генерации текста, изображений, анализе данных и программировании с помощью нейросетей.
В коэволюции выиграет тот, кто принимает и понимает принцип действия новых технологий. В сообществе сейчас часто звучит сленговое «кентавр» — так называют тех, кто использует в своей деятельности ИИ-технологии. То есть, кентавр — это врач+ИИ, водитель+ИИ, преподаватель+ИИ.
В университетах благодаря промпт-инжинирингу можно быстро составлять планы и учебные программы, индивидуальные образовательные и научные траектории. В строительстве этот навык поможет в проектировании; в соцсетях — в создании иллюстраций, контент-плана и т. д. Большие языковые модели применимы в сельском хозяйстве, фармакологии, гейм-дизайне, музыке — где угодно.
Линейный сотрудник, участвующий в процессах обработки информации, должен при получении задачи спрашивать себя: как мне поможет её решить большая языковая модель или агент на её основе? Руководитель должен ставить вопрос: как поставленную передо мной цель достигнуть при помощи больших языковых моделей?
Навыкам промпт-инженерии можно обучить вообще всех сотрудников, которые работают с информацией. На основе языковых моделей они могут создать интеллектуальных агентов для решения тех или иных задач.
Например, при подготовке презентаций можно пользоваться для ускорения своей работы ботом-художником и ботом, помогающим создавать структуру и наполнять слайды текстами.
Основные принципы промпт-инжиниринга
Основные принципы промпт-инжиниринга зимой 2023–2024 гг. описали в своей статье на основе работы с нейросетью ChatGPT-4/4o трое исследователей из MBZUAI — университета искусственного интеллекта, базирующегося в Абу-Даби. В тексте 26 принципов, объединённые в пять групп.
1. Структурные принципы.
Здесь исследователи, например, рекомендуют:
- указывать для нейросети аудиторию, к которой обращён результат (например, «объясни принцип круговорота воды для ученика начальной школы»);
- давать ИИ начало мысли, которую нужно продолжить;
- использовать только утвердительные конструкции. С этим, к слову, многие не соглашаются, потому что и с отрицательными директивами нейросети справляются;
- использовать разделители: «Инструкция», затем «Пример», после этого — «Вопрос».
2. Описание задачи.
В этом разделе мы описываем, что нам нужно и какого результата мы хотим добиться от нейросетки. Исследователи рекомендуют:
- давать подсказки: «объясни простыми словами», «используй простой язык», «используй тот же стиль, что и в образце»;
- попросить ИИ проверить, насколько беспристрастен ответ, не опирается ли он на стереотипы.
3. Взаимодействие с пользователем.
Языковую модель можно побудить задавать дополнительные вопросы для того, чтобы она получила достаточно информации для необходимого результата. Используйте фразу: «С этого момента я хотел бы, чтобы ты задавала мне вопросы о задаче».
В конце своего общения с ИИ по одной теме можно подытожить всё сделанное до этого, чтобы сгенерировать подробный ответ со всей необходимой информацией.
4. Стиль общения с ИИ.
Исследователи призывают настойчиво требовать от нейросети результата:
- пишите «твоя задача», «ты должен». Исследователи даже рекомендуют угрожать и обещать поощрение нейросети, добавляя такие фразы, как «ты будешь оштрафован», или, наоборот, «даю чаевые за лучшее решение»;
- не надо быть вежливым: слова «пожалуйста», «будьте добры» можно опустить. Впрочем, и на этот счёт есть другие мнения среди исследователей;
- повторяйте определённые слова или фразы несколько раз.
5. Сложные задачи.
Здесь исследователи призывают разбивать наиболее трудные запросы на последовательность простых.
Ещё один «секрет» — в контекстном прогреве. Сначала — предварительная беседа, small talk c ИИ-ботом на заданную тему, а затем — промпт. Это поможет получить хороший результат.
Основные техники промпт-инжиниринга
Главных техник промптинга несколько.
- Zero-shot prompting
Это самая распространённая техника: обычный вопрос нейросети, на который она ответит в свободной форме, основываясь на общем представлении о предмете.
- One-shot и Few-shot prompting
One-shot prompting — когда ИИ получил один пример. Few-shot — когда подсказок несколько.
Покажем, как это работает, на простейшей загадке.
Спрашиваем у нейросети: «Цветок — сколько?» ИИ пытается предположить ответ: «Цветок — одно слово». Это zero-shot prompting.
Теперь используем one-shot prompting: «Роза — четыре, цветок — сколько?» ИИ получил подсказку и сообразил: «Если вы имеете в виду количество букв в слове "цветок", то их шесть».
Несколько подсказок дали бы нейросети ещё больше информации для правильного ответа.
- Chain-of-thought prompting
Это «доспрашивание»: получив первый ответ, мы задаём дополнительные вопросы или даём новые данные. Можно добавлять контекст, роли получателей информации и автора.
Например, моно делать так: сначала поставить задачу, потом добавить контекст и детали, затем дать инструкцию, назначить роль и задать стиль и тон.
- Self-Consistency
Это техника, когда языковая модель проверяет сама себя. Сначала ИИ генерирует ответ, а затем по просьбе пользователя («Проверь согласованность результатов с исходными данными») пересматривает его на согласованность.
- Generated Knowledge Prompting
Техника подразумевает, что пользователь, получив недостаточный ответ, самостоятельно насыщает языковую модель необходимыми данными для получения более развёрнутого результата.
Используются и более сложные техники: Tree of Thoughts (дерево мыслей), Prompt Chaining (разбивка задачи на подзадачи) и т. д. С развитием больших языковых моделей методов промптинга становится только больше.