Что именно такое A/B тестирование и почему оно используется
Что именно такое A/B тестирование и почему оно используется
сплит эксперимент представляет формат подход сравнения нескольких а также разных вариантов веб-страницы, дизайна, копирайта, кнопки, анкеты, рассылки, рекламного объявления либо прочего веб объекта. Его цель заключается в необходимости задаче, для того чтобы выяснить, который вариант результативнее работает в практике. Взамен предположений и субъективных суждений применяется тест в рамках реальной посетителей, где первая часть получает формат A, а вторая — вариант B.
Подобный метод помогает формировать решения по результатах информации, вместо этого не на субъективных предпочтений а также случайных выводов. Внутри экспертных публикациях, среди них 1вин, нередко указывается, что A/B эксперимент особо ценно там, где точечные изменения имеют шанс влиять на поведение пользователей: клики, регистрации, заполнение анкет, длину просмотра, удержание, покупки, подписки а также прочие нужные действия. Подход позволяет увидеть, реально ли конкретно правка улучшает 1win показатель.
По какому принципу проводится A/B эксперимент
Логика сплит эксперимента довольно несложен. Вначале определяется элемент, какой нужно оценить. Объектом проверки способен оказаться заголовок, цвет CTA-элемента, порядок блоков, текст подсказки, логика поля ввода, картинка, стоимость, тип условия или позиция важного действия. Далее готовятся не менее двух версии: первоначальный а также тестовый. Затем этого посещения делится среди версиями согласно до запуска установленным правилам.
Одна группа пользователей продолжает получать первоначальную страницу, а тестовая видит обновленную. Система фиксирует сведения касательно поведении любой части затем анализирует показатели. В случае если вариант B дает лучший результат при достаточном объеме наблюдений, эту версию получается внедрять. Когда отличия не наблюдается а также новая вариация работает менее эффективно, изменение отклоняется. Именно в данной логике а также заключается прикладная ценность проверки: он позволяет оценивать идеи перед массового 1вин внедрения.
Зачем нужно А/Б тестирование
A/B тестирование нужно для снижения сомнений. На уровне веб сервисах в том числе малая правка имеет шанс воздействовать в отношении восприятие интерфейса. Конкретный текстовый блок имеет шанс оказаться понятнее другого, сжатая анкета может проходиться регулярнее длинной, а намного более заметная кнопка имеет шанс увеличить объем нажатий. Если не использовать проверки подобные решения обычно сохраняются догадками.
Эксперимент дает возможность оптимизировать платформу поэтапно. Без необходимости полной реконструкции целого проекта либо аппа получается проверять отдельные объекты а также измерять реальный результат. Это уменьшает вероятность неудачных правок, экономит ресурсы а также дает возможность накапливать понимание касательно действиях посетителей. С течением периодом специалисты 1 win собирает не просто комплект мнений, но модель валидированных действий.
Какие именно объекты допустимо тестировать
Сравнивать можно почти каждый объект, какой влияет на действия пользователя. Как правило в большинстве случаев оценивают названия, разделы, призывы на клику, надписи CTA-элементов, анкеты создания профиля, место блоков, визуалы, карточки позиций, порядок шагов, инструменты отбора, навигацию, визуальные блоки, сообщения, email-сообщения и промо объявления. Важно, чтобы выбранный элемент оставался объединен с конкретной заданной целью.
В случае если ориентир состоит в процессе увеличении переданных обращений, разумно сравнивать анкету, формулировку около этого блока, число строк а также заметность кнопки. В случае если необходимо увеличить объем изучения, стоит оценивать переходы, блоки рекомендаций, связанные линки и логику раздела. Чем прямее соотношение 1win среди правкой плюс метрикой, тем информативнее итог эксперимента.
Проверяемая идея в роли база проверки
Любой хороший А/Б тест начинается с предположения. Гипотеза формулирует, какое правка предлагается, по какой причине такая правка может сказаться по части результат плюс какой именно результат может сдвинуться. К примеру, допустимо предположить, будто сокращение формы оформления аккаунта сократит объем незавершенных действий, поскольку ведь человеку будет необходимо меньший объем минут ради выполнения действия.
Хорошая проверяемая идея не обязана должна казаться чрезмерно общей. Формулировка наподобие «сделать интерфейс лучше» не помогает позволяет оценить результат. Более ценный пример: «когда обновить растянутый текст кнопки на сжатый плюс конкретный, объем переходов увеличится, поскольку ведь ожидаемый результат окажется понятнее». Подобная идея сразу 1вин указывает элемент эксперимента, логику плюс показатель.
Контрольная и экспериментальная выборки
Внутри сплит проверке исходная часть получает первоначальный версию, тогда как экспериментальная — новый. Такое разделение важно ради честного сравнения. В случае если без контроля обновить страницу а также сопоставить метрики перед плюс после изменения, итог может испортиться по причине сезонности, рекламной кампании, изменения каналов посещений, событий, технических проблем либо других окружающих факторов.
Параллельный вывод отличающихся решений сокращает воздействие внешних обстоятельств. Обе аудитории находятся внутри схожей ситуации: один и тот идентичный срок, одинаковые же потоки трафика, похожие платформы а также единый фон. Из-за этого различие по результатах с высокой 1 win повышенной долей уверенности связано именно с конкретным изменением, но не столько с внешними случайными обстоятельствами.
Какие именно метрики применяются в сплит проверках
Показатель — является число, на основе которого измеряется итог эксперимента. Выбор критерия зависит с учетом цели эксперимента. В случае страницы с размещенной формой значимы передачи форм, для онлайн-магазина — сохранения внутрь корзину и транзакции, для медиаресурса — длина изучения и длительность чтения, для приложения — оформления профилей, активации, возвращаемость плюс следующие 1win события.
Важно разграничивать ключевую плюс дополнительные критерии. Основная демонстрирует, для чего проводится эксперимент. Дополнительные помогают понять сопутствующие эффекты. К примеру, правка CTA способно увеличить переходы, но уменьшить ценность следующих действий. Поэтому полезно смотреть не исключительно на первый шаг, а также также по следующее действие: завершение заявки, возвращения, отказы, сбои плюс итоговую эффективность события.
Статистическая достоверность
Статистическая достоверность отражает, насколько реалистично, поскольку зафиксированная отличие среди версиями не считается оказывается случайной. В случае если первый решение слегка превосходит второй вслед за ряда десятков посещений, это еще не показывает преимущество. На фоне ограниченном объеме сведений итог имеет шанс оперативно измениться, если 1вин аудитория станет объемнее.
Для надежного заключения необходимо достаточное число наблюдений. Если ниже ожидаемая дельта между версиями, настолько больше данных потребуется получить. Если изменение обязано повысить показатель только около несколько процентных пунктов, проверке потребуется повышенный объем времени и пользователей. Расчетная существенность позволяет не делать выносить преждевременные выводы с опорой на результатах нестабильных скачков.
Масштаб наблюдений и продолжительность эксперимента
Масштаб выборки влияет на точность вывода. Когда тест получает очень небольшое число пользователей, выводы могут стать сомнительными. В частности, малое число лишних кликов у первой аудитории способны выглядеть как рост, при этом на крупном масштабе окажутся простой колебанием. Из-за этого перед начала важно понимать, какое количество посетителей 1 win или действий нужно с целью оценки предположения.
Длительность проверки также имеет важность. Чрезмерно короткий тест способен не показывать различия между рабочими и выходными периодами, дневной и вечерней посещаемостью, разными источниками трафика. Чаще всего тест должен охватывать полный цикл поведения аудитории. Но при таком подходе очень долгий период проверки тоже неподходящ, если окружающие факторы могут существенно измениться.
Зачем опасно корректировать тест во период запуска
Распространенная из частых проблем — делать корректировки внутрь эксперимент после старта. Когда в середине проверки изменить текст, аудиторию, оформление, параметры показа или цель, наблюдения станут неоднородными. Тогда окажется сложно выяснить, что именно сказалось по части результат. Проверка потеряет прозрачность, при этом выводы окажутся ненадежными 1win.
До запуском необходимо зафиксировать предположение, версии, показатели, разбивку аудитории плюс условия остановки. Вслед за старта лучше не нужно вмешиваться без наличия серьезной основания. Если обнаружена проблема в запуске или служебный сбой, лучше остановить проверку, починить проблему и создать новый тест, вместо того чтобы пытаться интерпретировать смешанные показатели.
Параллельное проверка нескольких правок
В отдельных случаях формируется идея оценить одновременно группу правок: обновленный headline, другую кнопку действия, сокращенную форму а также обновленный порядок секций. Подобный вариант способен дать общий результат, однако не покажет объяснит, какой именно именно фактор сказался на показатель. Если обновленная вариация выиграла, сохранится неочевидно, какая правка сработало сильнее прочего.
Для корректной проверки чаще всего изменяют отдельный важный объект на 1вин одну проверку. Когда нужно проверить многие вариаций, применяется многофакторное тестирование. Такой метод труднее, предполагает большего трафика а также корректной расшифровки. Ради основной части целей А/Б тест с единственной понятной гипотезой дает более чистый плюс ценный эффект.
Варианты A/B проверки в дизайне
В UI-средах A/B эксперимент регулярно применяется для повышения понятности действий. К примеру, допустимо сопоставить две вариации анкеты: расширенную с большим количеством элементов ввода и краткую с минимальным сокращенным числом сведений. Если короткая анкета усиливает объем оконченных оформлений профиля без потери ценности обращений, ее получается признавать более удачной.
Другой случай — сравнение формулировки кнопки. Общая фраза способна оказаться не такой ясной, относительно точное описание результата. Кроме того проверяют позицию элементов действия, очередность информационных секций, оформление 1 win пояснений, наличие индикатора прогресса, формат показа ошибок плюс объем шагов на протяжении сценарии. Отдельный подобный фактор воздействует по части то самое, как просто завершить заданное шаг.
A/B тестирование внутри содержании
На уровне содержании эксперимент позволяет определить, какие headline-блоки, анонсы, схемы а также варианты эффективнее удерживают интерес. Можно сопоставлять разные интро, длину текста, последовательность доводов, наличие списков, оформление карточек, описание плюсов либо формат объяснения непростой задачи. Вместе с таком подходе важно измерять не только только переходы, однако и дальнейшее взаимодействие.
Headline способен усилить число переходов, но если контент не сможет соответствует интересам, вырастет часть уходов. Поэтому текстовые эксперименты должны анализировать качество чтения: длительность чтения, прокрутку, клики в пределах сайта, повторные визиты и завершение нужных событий. Качественный итог — представляет собой не просто захват интереса, но соответствие ожидания а также материала.
A/B тестирование внутри email-кампаниях
В email-кампаниях обычно проверяют заголовки сообщений, название адресанта, стартовые предложения, период отправки, размер email, место CTA-элементов и тексты условий. Один сегмент аудитории открывает контрольную версию письма, другая часть — тестовую. Вслед за этого сравниваются open rate, клики, отписки, негативные сигналы и дальнейшие реакции на сайте.
Необходимо не стоит ограничиваться показателем открытий. Subject-строка email может быть выразительной а также привлекать внимание, при этом когда формулировка не сможет отвечает контенту, нажатия и уверенность могут уменьшиться. Из-за этого корректный почтовый эксперимент оценивает всю цепочку: просмотр, нажатие, активность вслед за нажатия а также отклик аудитории касательно сообщение.