Первостепенное значение размера выборки при анализе ставок

Рейтинг: 4.6 из 5
Автор
Вадим Соколов
Рейтинг автора
4.6

Результаты краткосрочных ставок не говорят с большой «уверенностью», насколько высока вероятность того, что стратегия будет успешной в долгосрочной перспективе. Чем больше у вас результатов, тем больше ясности и точности вы получите при проверке прибыльности вашей стратегии. По сути, большой размер выборки данных повышает уверенность и снижает неопределенность.

Размеры образцов в ставках

Делая ставки, мы можем анализировать прошлые данные, чтобы определять оценки или тенденции. Размер выборки, то есть общее количество зарегистрированных ставок, определяет объем имеющейся информации и (частично) определяет точность или уровень уверенности в наших оценках.

В некоторых других моих сообщениях в блоге (например, в моем анализе Drifters & Steamers) я упоминаю «тестовую стратегию» записанных ставок с использованиемреальныхкоэффициентов. Используя тот же набор данных, я хочу проиллюстрировать важность использования подходящего размера выборки. Метод выбора используемой стратегии не имеет отношения к этому посту - мы ищем ответ на один ключевой вопрос:

Какова предполагаемая (долгосрочная) доходность метода выбора ставки?

При оценке доходности мы надеемся с уверенностью сказать , прибыльна ли стратегия, и определить, какой% ROI мы ожидаем получить в будущем.

Опасности небольшого размера выборки

Определить «малый» или «большой» размер выборки на самом деле довольно сложно. Лучший вариант - всегда собирать как можно больше данных. Взгляните на первые результаты стратегии тестирования ...

Первые 15 дней стратегии тестирования дали следующие результаты:
  • Ставки: 2375 ставок
  • Средний коэффициент: средний коэффициент 9,95
  • Доходность: + 5,77%

Достигнутая доходность + 5,77% и положительная тенденция на графике являются многообещающим признаком, учитывая, что в общей сложности было размещено 2375 ставок - на первый взгляд значительный размер выборки, чтобы основывать будущие прогнозы на…

Наша расчетная доходность связана с уровнем неопределенности, который зависит от лежащей в основе изменчивости данных, а также от размера выборки. Чемболее изменчивойявляется выборка, тембольше неопределенностьв нашей оценке.

Учтите следующие неопределенности в нашей выборке:

  • Был ли метод выбора ставок полностью объективным?
  • Представляют ли первые 15 (последовательных) дней все дни в году?
  • Был ли наш выбор выполнен в нехарактерно хорошей форме или это нормально?
  • Способны ли средние шансы (9,95) давать результаты с высокой дисперсией, которые колеблются в одну или другую сторону?
  • Положительно или отрицательно повлияла погода на результаты?

Я считаю, что метод отбора достаточнообъективен,поскольку он основан исключительно на прошлых результатах гонок. Но другие факторы неопределенности, перечисленные выше, среди многих других, могут быть важными факторами для положительных наблюдаемых результатов в течение первых 15 дней.

Хотя выбор выигрышной серии может показаться немного циничным, лучше критически относиться к своим результатам и продолжать сбор данных, а не делать наивные предположения. Отсутствие полного анализа результатов может привести к реальным денежным потерям. Помните: большие размеры выборки повышают точность имеющейся информации и уменьшают неопределенность.

Важность больших размеров выборки

Как я уже упоминал, стратегия тестирования действительно ухудшается, несмотря на исключительно хорошее и многообещающее начало. Это было очевидно из продолжающегося сбора данных в тех же условиях, когда в выборке было сделано 17 717 ставок на 2 фунта стерлингов.

Следующий график включает начальные 2 375 ставок до 17 717 общих ставок.
  • Ставок: 17 717
  • Средние шансы: 9,9
  • Доходность: -0,63%

Чем больше размер выборки, тем выше точность. Предположения, которые мы могли сделать ранее на основе меньшего набора данных, теперь несколько опровергнуты. Важно отметить, что доходность (ROI) составляет -0,63%. Несоответствие на графике не дает нам реальных оснований полагать, что этот метод выбора выгоден.

Теоретически, если бы мы могли взять эту выборку до бесконечности и включить каждую будущую ставку, то мы получили бы истинное значение, которое пытаемся оценить, - фактическую доходность стратегии без неопределенности. Это, конечно, невозможно, и, несмотря на повышенную точность, достигаемую за счет увеличения размера выборки, наши прогнозы по-прежнему необязательнорепрезентативны для будущего.

Тем не менее, несмотря на некоторую степень неопределенности, учитывая мой опыт ставок, я бы не стал торопиться использовать эту стратегию ставок!

Шаг дальше: мощность и размер эффекта

Увеличение размера выборки дает больше возможностей для обнаружения различий.

Предположим, что нас также интересовало, есть ли разница в соотношении молодых и старых лошадей-победителей. Мы можем, например, полагать, что старые, более опытные лошади выступают лучше. Мы могли бы задать вопрос:

Является ли наблюдаемый эффект (разница в результатах)значительным,учитывая, что общее количество будущих ставок потенциально безгранично?

Или пропорции старых лошадей-победителей могут быть наблюдаемым эффектом случайно?

Не вдаваясь в подробности статистических тестов, стоит упомянуть, что вы можете пройти лишнюю милю, используя так называемый «биномиальный тест равных пропорций» или «двухпропорциональный z-тест». Если вы обнаружите, что нет достаточных доказательств, чтобы установить разницу между молодыми и старыми лошадьми, то результат не считается статистическизначимым. Обычно пороговый уровень выбирается до проведения теста (например, 10%) и называется «уровнем значимости». Если разница превышает 10% по большому набору данных, мы считаем, что существует «разница значимости».

Если мы увеличим размер выборки нашей стратегии тестирования до, скажем, 100 000 ставок, у нас будет больше данных для поддержки оценок, основанных на лошадях разного возраста. Таким образом, увеличение размера нашей выборки увеличиваетспособностьобнаруживать разницу. Более формально:

Последние мысли

Большой размер выборки дает более надежные результаты с большей точностью и мощностью, но выполнение тщательного анализа также требует больше времени и денег. Поэтому автоматизация сбора данных или использование источников доступных данных имеет важное значение для точных прогнозов и предположений.

Помните, что очень важно использовать достаточно большой размер выборки, когда вы пытаетесь сделать значимые выводы из результатов ставок. Это касается и типстеров. Но постарайтесь не тратить зря ресурсы, отбирая больше, чем вам действительно нужно.

Новости спорта

Изначально сайт создавался для пользователей со всех стран мира. Международный домен ориентирован на самых разных пользователей. Страницы сайта переведены на 46 языков, среди которых есть и азербайджанский. Это выгодно выделяет платформу на фоне конкурентов, так как многие из них либо не работают на территории данной страны, либо не имеют местной локализации.

Больше новостей