Задача геймдизайнера — создать нужный опыт для игрока. Тут есть проблема неопределённости: часто геймдизайнер не может быть уверен, что игрок получает от игры именно тот опыт и те эмоции, которые он задумывал.
Узнать это наверняка можно только после релиза. Но есть способ снизить риск появления в игре неудачных механик или непривлекательных артов. Этот способ — плейтесты, то есть испытания ранних билдов игры на обычных игроках.
Мы изучили интервью и лекции разработчиков и рассказываем, как создатели игр делают опыт игрока приятнее и комфортнее при помощи плейтестов.
Автор: Денис Дудушкин
Источник
Есть много типов тестирования игр. В основном выделяют QA (контроль качества), фокус-группы, тестирование юзабилити и, наконец, плейтесты. Именно помогает, дарит ли последнее необходимое удовольствие от игрового процесса. Поэтому они очень ценятся разработчиками и используются в индустрии всё активнее.
Когда я присоединился к Naughty Dog для работы над Jak 3, мы провели около 4 или пяти плейтестов на всем протяжении. В случае с Uncharted 3 мы провели 21 плейтест лишь за последние 6 месяцев разработки. Вот насколько они для нас важны.
Бывший геймдизайнер Naughty Dog
Источник цитаты: youtube.com
Uncharted 3: Обман Дрейка
Отчасти такая любовь к плейтестам связана с итеративным подходом к разработке. Суть этого метода в том, что почти все элементы игры постепенно улучшаются по одному алгоритму. Его формулировки могут отличаться от студии к студии, но геймдизайнер Джесси Шелл в книге «Геймдизайн» предлагает универсальный вариант:
1. Определиться с дизайном.
2. Рассчитать самые большие риски дизайна.
3. Создать прототипы, которые уменьшат эти риски.
4. Протестировать прототипы.
5. Определиться с деталями дизайна, отталкиваясь от полученной информации.
6. Вернуться к пункту No2.
Источник
Видеоигры, а точнее их отдельные элементы, несколько раз проходят этот цикл, становясь всё лучше и лучше с каждой итерацией. В центре этой спирали находится тестирование, которое нередко подразумевает именно плейтесты. Это очень ответственный этап, от которого зависит финальный облик многих механик игры. А значит, при проведении плейтестов студия должна быть уверена, что делает всё правильно.
Для того, чтобы понять, как сделать плейтесты полезными и эффективными, нужно ответить на несколько вопросов: что именно тестировать, как это делать, на ком и, наконец, когда стоит начинать. Универсального представления об идеальном плейтесте у разработчиков не существует, и они используют разные подходы.
Источник
Как правило, чем раньше студия сажает тестеров за игру, тем лучше. До сих пор бытует мнение, что плейтестеры — это счастливчики, которые раньше других смогли добраться до ещё не вышедшей, но уже готовой игры. В реальности так происходит не всегда, — ведь как только у студии появляется простейший играбельный прототип, его уже можно и нужно тестировать.
Это продуктивнее и экономичнее, чем делать игру вслепую. Чем дольше элемент игры находится в разработке, тем больше на него тратят ресурсы, и тем дороже выйдет его удалять. Прототипы заранее избавиться от таких проблемных кусков или даже от игры в целом, если она не представляет.
Звездные войны 1313
Вопрос об аудитории плейтестов уже не столь однозначен. Одни разработчики считают, что чем хуже геймдизайнер знаком с человеком, тем лучше он подойдет для тестирования. Другие отмечают, что чем больше людей вовлечены в тест, тем лучше, и не столь важно, кто именно будет играть.
Универсального ответа не существует. Во-первых, не бывает идеальной группы игроков для плейтестов. Во-вторых, во многом выбор аудитории зависит от наличия времени и ресурсов у студии. Например, инди-разработчики часто испытывают игру на всех подряд, — ведь времени и ресурсов на создание качественной выборки внутри целевой аудитории у них нет.
Источник
Такое решение позволяет в короткие сроки собрать солидный массив фидбэка, но пожертвовать его качеством. Зато, как отмечает дизайнер Эдриан де Йонг, выход за пределы целевой аудитории помогает выявить интересные детали и сделать игру более доступной для самых разных игроков.
Не ограничивайте тестеров четкой группой людей. Даже если они не входят в целевую аудиторию, все, как мне кажется, что-то сказать об игре. Моя мама даёт мне потрясающий фидбэк, хотя она не геймдизайнер. Используйте коллег по работе, других разработчиков, друзей-игроков, друзей без опыта игры, родственников, детей, стариков, людей с разным культурным бэкграундом, фанатов. Это поможет вам понять, как разные люди играют в вашу игру.
Независимый разработчик
Источник цитаты: youtube.com
В ранних билдах игры Hidden Folks — игры де Йонга, — у многих NPC над головой были стандартные иконки диалога. Если игрок использовал с этим персонажами, они озвучивали какую-нибудь шутку или забавную фразу.
Источник
Во время плейтестов дизайнер заметил, что опытные игроки чаще всего тщательно проверяют карту от этих символов, в то время как неопытные переставали обращать на значки внимание после пары взаимодействий с NPC. Оказалось, что такой символ уже давно воспринимается игроками как индикатор, которая помогает помочь в прохождении. Но в Hidden Folks такое обозначение неожиданно добавило в игру лишний гринд.
Подобные находки бывают крайне полезными, поэтому не помешают ни одному дизайнеру. Довольно редко устраивают массовые плейтесты своих игр. Дело в том, что разработчикам ААА-проектов больше волнует качество и оперативность фидбэка от плейтестеров.
Скрытые люди
Например, ранние версии Overwatch обновлялись практически ежедневно — по словам дизайнера игры Роуэна Гамильтона, вся её разработка была построена на «культуре плейтестов». И если обратная связь задерживалась хотя бы на пару дней, она часто теряла всю актуальность.
Организовывать плейтесты для Overwatch было сложнее, чем для одиночной игры, — ведь в сеансе одновременно должны участвовать 12 человек. Буквально каждое нововведение требовало отдельного теста.
Геймдизайнеру нужен контекст, чтобы понимать, как герой, способность или карта ощущаются, когда в игре ещё одиннадцать игроков. Пока мы не ощутим этот полноценный игровой опыт, очень сложно оценивать, насколько удачно работают отдельные элементы.
Ведущий программный инженер Blizzard
Источник цитаты: gdcvault.com
Источник
У таких крупных компаний, как Activision и Ubisoft, есть целые отделы, в которых работают тестеры на постоянном окладе. Другие студии не пользуются услугами отдельных аутсорс-лабораторий. Подбор игроков там более тщательный — например, учитывается, что чем лучше человек с игрой или ее создателями, тем менее ценным будет отзыв от него.
Это не значит, что коллеги или друзья могут дать полезный фидбэк, — но проанализировать информацию от них сложнее. Друзья и родственники хороши тем, что готовы предоставить очень детальный отзыв — расспрашивать их можно долго, причём как во время плейтестов, так и в неформальной обстановке после. Однако исключительной искренности ждать не стоит, как друзья не склонны критиковать разработчика.
Источник
Сами создатели игры хорошо знакомы с собственным проектом, и поэтому их оценка будет обдуманной и глубокой — возможно, слишком глубже. Разработчики могут делать акцент на таких нюансах, которые рядовые пользователи и не приметят. Похожая проблема появляется, когда на плейтесты приглашают хардкорных игроков. Они, разработчикам, могут подробно отчитаться о пройденном отрезке игры, но их фидбэк тоже рискует оказаться чересчур глубоким.
Чтобы получить обратную связь от самых разных людей, разработчики нередко пользуются услугами «одноразовых» тестеров. Это игроки, которых приглашают в студию на одну или две сессии тестирования. Они дают более универсальное представление о том, какое первое универсальное впечатление рождает проект.
Источник
Однако, по словам Джесси Шелла, если студия выбирает этот путь, она должна безостановочно прогонять игру через одноразовых тестеров. Иначе может случиться так, что у игры будут очень яркое начало, но далее последуют посредственные эпизоды.
Идеальные условия тестирования часто подразумевают наличие людей, которые раньше никогда не видели вашу игру. В индустрии их называют «свежим мясом» или «одноразовыми тестерами». Их плюсы — в том, что люди, которые впервые знакомятся с вашей игрой, смотрят на нее свежим взглядом и замечают вещи, к которым вы уже привыкли. Если вам нужно получить ответы на вопросы, связанные с удобством использования, как в игре реализовано общение, или же узнать, какое она производит впечатление, такие тестеры могут быть очень ценными.
Геймдизайнер
Источник цитаты: schellgames.com
Минусы таких тестеров связаны с тем, что в играх обычно играют не один раз, —то есть игровые сессия может быть много. А привлекая к плейтестам исключительно «одноразовых», вы рискуете выпустить игру, которая произведет хорошее первое впечатление, но утомит игрока через несколько игровых сессий.
Источник
Формат проведения плейтестов тоже очень важен. Разработчикам нужно, чтобы фидбэк был максимально чистым, поэтому приблизить условия игры к естественным. Звучит несложно, но без подводных камней не обошлось и тут. Дело в том, что для игрока естественное окружение — это, как правило, его дом.
Обычно наиболее разумным способом оказывается проведение онлайн-плейтестов. Для инди-студий этот способ оптимален, так как он дешевле и проще в организации. Дополнительный процесс поиска необходимой аудитории упрощают современные сервисы, работающие с краудсорсом и небольшими заданиями. Например, Amazon Mechanical Turk и Яндекс.Толока запускают простые системы, в которых можно отсортировать тестеров по полу, возрасту, социальному статусу и т.д.
Источник
Крупные студии редко используют такие сервисы, — в дистанционном формате сложнее отслеживать объективные физиологические показатели тестеров. Например, некоторые технологии умеют замерять сердцебиение тестера по изменениям в цвете кожи, но они пока что недостаточно надёжны. Также есть и более масштабная проблема — риск утечки. Онлайн-плейтест предполагает, что билд игры оказывается в интернете и рискует попасть не в те руки.
Поэтому компании всё же стараются проводить плейтесты внутри студии. Это позволяет использовать инструменты для установки биологического состояния игрока.
Источник
Все описанные этапы ведут к главному этапу тестирования — сбору и анализу информации. Этот процесс можно поделить на три категории: субъективные впечатления, действия в игре и биологический фидбэк. Для наиболее полного анализа нужно использовать все эти методы, но не всегда у разработчиков есть на это ресурсы. Поэтому иногда для анализа используется что-то одно.
Субъективные впечатления после плейтестов собирать сложнее всего, ведь для этого нужно определить оптимальную методологию. Например, большинство геймдизайнеров считают, что нельзя задавать игроку прямо во время плейтеста, так как это нарушает естественный поток игры. В то же время удачный вопрос может сильно помочь разработчику, но только если вовремя его задать, — после игрока может уже забыть свои действия и впечатления.
Источник
Даже успешно полученный фидбэк бывает сложно проанализировать. С одной стороны, неправильной обратной связи не бывает — игрок получил опыт и поделился им. С другой, к каждому тезису тестера разработчики должны относиться критически. Люди часто склонны не только описывать замеченные проблемы, но и с ходу предлагать их решение. В геймдизайне такое решение далеко не всегда оказывается верным.
Эдриан де Йонг называет это явление «информацией секонд-хенд». Разработчики часто сталкиваются с «плохими» данными, которые приводят геймдизайнеров не в том направлении.
Плохие данные — вводящие в заблуждение или нечёткие результаты плейтестов. Они вынуждают разрабочтика гадать, как лучше поступить с полученным фидбэком. А это может сделать игру плохой или лишить её уникальности.
Независимый разработчик
Источник цитаты: youtube.com
Источник
Если во время плейтеста шутера игроку не хватило патронов, то он может сказать, что их количество стоит увеличить. Но корень проблемы может быть совершенно в другом. Например, в том, что дизайнер не сумел объяснить игроку, как лучше справиться с конкретным противником, из-за чего тестер потратил на того слишком много боеприпасов. Или всё может быть дополнительными патронами, которые находятся в неочевидных местах. Или же, наконец, патроны и вовсе могут быть в арсенале игрока, но просто не для того оружия, из которого ему понравилось стрелять.
Де Йонг столкнулся с похожей проблемой, когда тестировал Hidden Folks. В игре нужно искать ключевые предметы, выбирая их на сенсорном экране. В одном из заданий игрокам нужно было открыть гараж не нажатием на экран, а свайпом, который до этой в игре не использовался. Тестеры преимущественно не понимали новой логики и почти единогласно предлагали добавить небольшой туториал, объясняющий механику.
Источник
Это сработало, но на смену одной проблемы пришла другая. Миссия, до этого казавшаяся очень сложная, стала, наоборот, игроки выполняли задание мгновенно. В разработчики пришли к компромиссному решению: добавили контекстные анимации вместо обучения. Когда тестеры нажимали на дверь, она не открывалась, но начинала дёргаться, что давало игрокам понять: «это важный объект, но я что-то делаю не так».
Иногда информация воспринимается неправильно уже по вине разработчиков. Чтобы выявить какие-то частные особенности, можно упустить общую картину и не заметить очевидные проблемы. Например, можно долго тестировать игру с локальным кооперативом на четырёх человек, искать проблемы с балансом или динамикой, но забыть о том, что у многих игроков попросту нет под четырёх контроллеров.
Марио Карт 8 Делюкс
Чтобы точнее выявлять проблемы во время плейтестов, мнения игроков часто сравнивают с результатами даталоггинга, — то есть системы, которые отслеживают действия тестеров во время игры. Они умеют собирать самые разные параметры: как часто игроки умирают в каждом эпизоде, какое оружие чаще используют, насколько быстро продвигаются в прохождении и так далее.
Даталоггинг может использовать и уникальные для конкретных игр системы измерения. Например, разработчики Uncharted 3 — игры, которые регулярно нужно карабкаться по различным уступам — во время плейтестов собирают информацию о количестве прыжков на одном месте. На основе собранных данных выстраивалась температурная карта, которая помогала найти неинтерактивные места, привлекающие внимание игроков. Информацию с карты передавали дизайнерам, чтобы те сделали объект менее заметным.
Uncharted 3: Обман Дрейка
Можно подумать, что даталоггинг — самый эффективный и нужный элемент плейтестов, он помогает разработчику избежать субъективной оценки от игроков. Но его, как и любой другой статистический инструмент, нет смысла использовать без контекста.
На этой иллюстрации — таблица по Half-Life 2: Episode One, которая показывает среднее количество смертей на каждом уровне. Как видно, две сцены финальной ней трети игры намного сложнее остальных уровней. Но это не значит, что концовку надо упрощать, — ведь геймдизайнеры специально создали эти главы более напряженными.
Источник
Даталоггинг может служить своеобразной надстройкой, который позволяет проверить надёжность эмоционального фидбэка игрока. Исследователь игрового опыта в Volition Джордан Линн считает, что даталоггинг важен, но подходить к нему нужно с умом.
Плейтестинг и даталоггинг очень полезны. Одновременный анализ фидбэка игроков и данных позволяет получить доступ к информации, которую можно получить, если использовать лишь что-то одно.
Исследователь игрового опыта Deep Silver Volition
Источник цитаты: gdcvault.com
Во-первых, не стоит вестись на соблазн измерить все возможные показатели в игре. В теории это поможет найти больше незамеченных проблем, но анализ «голых» цифр — это кропотливая работа. Необходимо не только привести все показатели в приемлемый вид, но сравнить их с живым фидбэком, а времени на это может не хватить.
Красная Фракция: Армагедон
Собранная в процессе тестирования информация может потерять актуальность уже через пару дней, поэтому Линн, например, ставит для себя мысленный дедлайн — на анализ информации он даёт себе 24 часа. Это нужно заранее продумать, чтобы узнать из плейтестов.
Во-вторых, информация, полученная при помощи даталоггинга, не всегда соотносится с фидбэком игроков. Такая проблема может проявляться по-разному. Например, объективная информация может конфликтовать с мнениями плейтестеров. Во время разработки Red Faction: Armageddon дизайнеры заметили, что в одном линейном эпизоде есть три места, где игроки умирали слишком часто. При этом сами тестеры никаких претензий к уровню не предъявили.
Красная Фракция: Армагедон
Когда информация донесли разработчиков до, это было запланировано, но в третьем действительно виновата дизайнерская ошибка. Подвешенный в воздушном контейнере контейнер по воздушному потоку, чтобы нейтрализовать робота, плохо выделялся на фоне остальных объектов.
Эта ситуация наглядно демонстрирует одну из фундаментальных проблем плейтестов: как бы хорошо разработчики ни симулировали естественные и комфортные для игры условия, тестер всё равно остаётся тестером. Ему платят деньги за работу, поэтому в некоторых ситуациях он может спокойнее отнестись к эпизодам, которые разозлят рядового игрока.
Биологический фидбэк — это самый технически продвинутый способ отследить эмоции игрока. Как и даталоггинг, он позволяет объективно измерять состояние тестеров, однако фокусируется только на их эмоциях. С помощью биологического фидбэка можно отследить самые разные показатели: сердцебиение, электроактивность кожи, положение глаз или выражение лица.
Для разработчиков это может быть очень полезно, но не её количественные характеристики: большинство описанных выше измерителей способны показать степень проявления или иной эмоции. Например, учащённый пульс подтвердил, что игрок получил сильную эмоцию после какого-нибудь скримера, но не расскажет, понравился ему этот момент или нет.
Источник
Это полезные инструменты, но с ними тоже нужно работать осторожно. Как отмечает штатный психолог Valve Майк Эмбиндер, их наличие может привести к неприятному феномену — «петле фидбэка».
Когда игрок видит, что его сердцебиение растет, то осознание этого еще может повысить — что делает информацию некорректной. Работая с эмоциями, всегда нужно помнить, что они нестабильны и изменчивы. Вы запишете эмоции тестера, но он может почувствовать что-то другое уже через час, минуту или даже пять секунд.
Психолог Valve
Источник цитаты: youtube.com
Технологии, которые позволяют увеличить конкретную эмоцию, — например, отслеживание выражения лица — пока что относительно ненадёжны и дороги, поэтому используются в плейтестах. Куда чаще биологический фидбэк тест для тестирования интерфейса через трекинг взгляда — или для экспериментов.
Например, Valve сделала игрубельный прототип Portal 2, управляя которым можно при помощи глаз.
Также компания проверяла надёжность «виртуального режиссёра» в Left 4 Dead, используя данные о сердцеби и электроактивности кожи игроков. «Режиссёр» замерял скорость продвижения игрока, его здоровье и другие параметры, после чего настраивает сложность игры в соответствии с ними. Когда разработчики тестировали эту систему, они использовали измерители биологических показателей, чтобы изучить влияние динамической сложности на эмоциональное состояние игрока.
Источник
В будущем биологическом фидбэк может повлиять не только на плейтесты, но и на опыт игры в реальном времени. Недавние патенты Sony на устройстве, отслеживающие сердцебиение игрока в комнате, косвенно подтверждают.
Можно использовать биологический фидбэк для того, чтобы менять геймплей. Например, привязать здоровье к эмоциональному состоянию: когда нервничает оно постепенно теряется.
Также можно использовать динамические подсказки. Если игрок вовлечен, то отвлекать его не стоит, а если ему скучно или он потерялся, можно сразу запустить всплывающие окна.
Психолог Valve
Источник цитаты: youtube.com