+7 495 120-13-73 | 8 800 500-97-74

(для регионов бесплатно)

Содержание

Что такое статическое электричество — Лайфхакер

Откуда берётся статическое электричество

Мир состоит из атомов. Это крошечные частицы, из которых построено наше тело, джинсы на ногах, сиденье в авто под пятой точкой и смартфон с Лайфхакером на экране.

Внутри атомов есть более мелкие элементы: ядро из протонов и нейтронов, а также электроны, которые вращаются вокруг него. Протоны заряжены со знаком плюс, электроны — со знаком минус.

Обычно у атома одинаковое число таких плюсов и минусов, поэтому у него нулевой заряд. Но иногда электроны покидают орбиты и притягиваются к другим атомам. Чаще всего это происходит в результате трения.

Движение электронов от одного атома к другому создаёт энергию, которую называют электричеством. Если направить её через провод или другой проводник, получится электрический ток. Его работу вы наглядно видите, когда заряжаете смартфон по кабелю.

Со статическим электричеством всё иначе. Оно «ленивое», не течёт и будто отдыхает на поверхности. У предмета появляется положительный заряд, если ему не хватает электронов, и отрицательный, когда они в избытке.

Как проявляется статическое электричество

1. Электрический разряд

Если надеть на ноги чистые сухие носки из шерсти и пошаркать ими по нейлоновому ковру, можно получить электрический разряд.

Во время трения электроны будут перепрыгивать с носков на ковёр и наоборот. В итоге они получат противоположный заряд и захотят уравновесить число электронов.

Если разница в их количестве достаточно большая, вы получите видимую искру, как только снова прикоснётесь носками к ковру.

2. Притягивание предметов

Если расчесать волосы пластиковой расчёской, она получит заряд статического электричества.

После этого она начнёт притягивать небольшие кусочки бумаги, пытаясь избавиться от дефицита или избытка электронов за их счёт.

3. Отталкивание предметов

Если натереть лист бумаги шерстяным шарфом, он получит статический заряд.

Когда вы попытаетесь согнуть бумагу, половинки начнут отталкиваться друг от друга именно из-за дисбаланса электронов.

Чем может быть опасно статическое электричество

Это явление способно привести к ряду опасных последствий.

1. Воспламенение

Статическое электричество может стать причиной пожара там, где используются легковоспламеняющиеся материалы — например, на полиграфических предприятиях.

На таком производстве много чернил и бумаги, которые быстро загораются. Они трутся об оборудование во время печати, возникает статическое электричество, появляется искра и начинается пожар .

2. Производственные нарушения

От статического электричества особенно страдают предприятия, которые производят пластмассу или текстиль.

Когда эти материалы положительно или отрицательно заряжены, они могут притягиваться или отталкиваться от рабочей поверхности.

Это нарушает процесс производства, поэтому предприятия используют ионизаторы воздуха, которые помогают предотвратить возникновение заряда.

3. Удар молнии

Во время перемещения воздушных потоков, которые насыщены водяными парами, возникает статическое электричество.

Оно создаёт грозовые облака с разным зарядом, которые разряжаются друг о друга или об озоновый слой. Так получаются молнии.

Молнии бьют в высокие здания, деревья и землю и становятся причиной поломок оборудования.

Как избежать появления статического электричества

1. Повышайте влажность

Сухой воздух в помещении — лучший друг статического электричества. Но оно практически не проявляется, если влажность превышает 85%.

Чтобы повысить этот показатель, регулярно проводите влажную уборку и используйте увлажнители воздуха.

Когда включено отопление, на батарею можно положить мокрую ткань, чтобы вода испарялась и делала воздух менее сухим.

2. Применяйте натуральные материалы

Большинство натуральных материалов сохраняют влагу, синтетические — нет. Поэтому первые меньше вторых подвержены возникновению статического электричества.

Если расчёсывать волосы пластиковой расчёской, они получат статический заряд и начнут разлетаться друг от друга, портя причёску. Этого можно избежать, используя аксессуары из дерева.

Такая же история с обувью на резиновой подошве. Она провоцирует создание статического электричества на теле. Но стельки из натуральных материалов нивелируют его эффект.

Футболки из хлопка, одежда из других натуральных тканей не создают статическое электричество. Искусственный свитер — наоборот.

3. Используйте заземление

С помощью него статическое электричество можно отвести в землю. Это касается не только громоотводов, которые перенаправляют заряд молний, но и работы с электрическим оборудованием.

Когда профессиональный мастер раскрывает ноутбук, чтобы почистить его от пыли, он обязательно использует специальный шнур заземления, закреплённый на руке, — антистатический браслет.

Антистатический браслет / aliexpress.com

Он нужен, чтобы избежать попадания разряда статического электричества от рук на микросхемы. Иначе он повредит их, и через время компьютер может выйти из строя.

Читайте также 🧐

Виды статического электричества. Возникновение и удаление статики

Нарушение баланса между электрическими зарядами внутри материала или на его поверхности это возникновение статического электричества. Заряд сохраняется, пока он не будет снят вследствие протекания электрического тока или разряда. Статическое электричество вызывается при контакте и разделении двух поверхностей, и хотя бы одна из поверхностей является диэлектриком – непроводящим электрический ток материалом. Со статическим электричеством большинство из людей знакомы, поскольку они видели искры в момент нейтрализации избыточного заряда, ощущали на себе разряд и слышали сопровождающий его треск.

Причины статического электричества

Вещества состоят из атомов, которые в обычном состоянии электрически нейтральны, поскольку содержат равное количество положительных зарядов (протонов ядра) и отрицательных зарядов (электронов атомных оболочек). Статическое электричество заключается в разделении положительных и отрицательных зарядов. При контакте двух материалов электроны могут переходить с одного материала на другой, что приводит к избытку положительных зарядов на одном материале, и равном избытке отрицательного заряда на другом материале. При разделении материалов образовавшийся дисбаланс зарядов сохраняется.

В контакте материалы могут обмениваться электронами; материалы, слабо удерживающие электроны, склонны их терять, в то время как материалы, в которых внешние оболочки атомов не полностью заполнены, склонны захватывать электроны. Этот эффект называется трибоэлектрическим, и приводит к тому, что один материал заряжается положительно, а другой отрицательно. Полярность и величина заряда при разделении материалов зависит от относительного положения материала в трибоэлектрическом ряду.

Материалы располагаются в ряду, один конец которого является положительным, а другой отрицательным. При трении пары материалов материал, располагающийся ближе к положительному концу ряда, заряжается положительно, а другой – отрицательно. Единого трибоэлектрического ряда (подобного ряду напряжений металлов), не существует, как нет и единой теории электризации. Обычно ближе к положительному концу ряда располагаются материалы с большей диэлектрической проницаемостью.

Порядок следования материалов в трибоэлектрическом ряду может быть нарушен. Так в паре шелк-стело, стекло отрицательно, в паре стекло-цинк, отрицателен цинк, а в паре цинк-шелк, отрицательно заряжается не цинк, как следовало бы ожидать, а шелк. Такое отсутствие упорядоченности называется трибоэлектрическим кольцом.

Трибоэлектрический эффект – основная причина возникновения статического электричества в повседневной жизни, при взаимном трении различных материалов. Например, если потереть воздушный шарик о волосы, он заряжается отрицательно, и может притягиваться к положительно заряженным источникам стены, прилипая к ней и нарушая законы тяготения.

Предупреждение и удаление статических зарядов

Предотвратить накопление статики очень просто – достаточно открыть окно или включить увлажнитель воздуха. Увеличение содержания влаги в воздухе приведет к увеличению ее электрической проводимости, аналогичного эффекта можно добиться ионизацией воздуха.

Особо чувствительны к статическим разрядам предметы можно защитить нанесением антистатического средства.

Особенно чувствительны к разрядам статического электричества полупроводниковые компоненты электронных устройств. Для защиты этих устройств обычно используются токопроводящие антистатические пакеты. Работающие с полупроводниковыми схемами люди зачастую заземляют себя антистатическими браслетами, надеваемыми на кисть руки. Избежать образования статических зарядов при контакте с полом (например, в больницах), можно путем ношения антистатической обуви с токопроводящей подошвой.

Разряд

Искра – это разряд статического электричества, когда избыточный заряд нейтрализуется потоком зарядов из окружения или к окружению. Электрический удар вызывается раздражением нервов при протекании нейтрализующего тока через человеческое тело. Запасенная энергия статики зависит от размера объекта, электрической емкости, напряжения, до которого он оказался заряженным, и диэлектрической проницаемости окружающей среды.

Для моделирования эффекта разряда статики на чувствительные электронные приборы, человеческое тело представляется как электрическая емкость в 100 пФ, заряженная до напряжения от 4 до 35 кВ. При касании объекта эта энергия разряжается менее чем за микросекунду. Хотя общая энергия разряда мала, порядка миллиджоулей, она может повредить чувствительные электронные приборы. Большие объекты запасают больше энергии, что представляет опасность для людей при контакте, или воспламенить искрой горючий газ или пыль.

Молния

Молния – пример статического разряда атмосферного электричества в результате контакта частиц льда в грозовых облаках. Обычно значительные разряды могут накапливаться только в областях в малой электрической проводимостью. Разряд обычно наступает при напряжении поля порядка 10 кВ/см, в зависимости от влажности. Разряд перегревает окружающий воздух с образованием яркой вспышки и звука треска. Молнии – всего лишь масштабный вариант искры статического разряда электричества. Вспышка возникает вследствие нагрева воздуха в канале разряда до такой высокой температуры, что он начинает излучать свет, как и любое раскаленное тело. Удар грома – последствия взрывного расширения воздуха.

Электронные компоненты

Многие полупроводниковые приборы электронных устройств очень чувствительны к присутствию статики и могут быть повреждены разрядом. При обращении с наноустройствами обязательно ношение антистатического браслета. Другой мерой предосторожности является снятие обуви с толстой резиновой подошвой и постоянное стояние на металлическом заземленном основании.

Образование статического электричества в потоках возгораемых и горючих материалов

Разряд статического электричества представляет опасность в отраслях промышленности, где применяются горючие вещества, где маленькие электрические искры могут привести к взрыву. Движение мельчайших частиц пыли или жидкостей с малой электропроводностью в трубопроводах или их механическое перемешивание может вызвать образование статики. При статическом разряде в облаке пыли или паров возможен взрыв.

Взрываться могут зерновые элеваторы, лакокрасочные фабрики, участки производства стекловолокна, топливозаправочные колонки. Накапливание заряда в среде происходит при ее электрической проводимости менее 50 пС/м, при большей проводимости образующиеся заряды рекомбинируют (рекомбинация – процесс, обратный ионизации), и накапливания не происходит.

Наполнение больших трансформаторов трансформаторным маслом требует соблюдения предосторожностей, поскольку электростатические разряды внутри жидкости могут повредить изоляцию трансформатора.

Поскольку интенсивность образования зарядов тем выше, чем выше скорость течения жидкости и диаметр трубопровода, в трубопроводах диаметром более 200 мм скорость течения жидкости ограничивается стандартом. Так, скорость течения углеводородов с содержанием воды обычно ограничивается на уровне 1 м/с.

Образование зарядов ограничивается заземлением. При проводимости жидкости ниже 10 пС/м этой меры оказывается недостаточно, и к жидкости добавляются антистатические присадки.

Перекачивание топлива

Перекачивание горючих жидкостей наподобие бензина по трубопроводам может привести к образованию статического электричества, а разряд может привести к возгоранию паров топлива.

Подобные случаи происходили на автозаправках и в аэропортах при заправке самолетов керосином. Здесь также эффективно заземление и антистатические присадки. Течение газа в трубопроводах представляет опасность лишь при наличии в газе твердых частичек или капелек жидкости.

На космических аппаратах статическое электричество представляет большую опасность вследствие низкой влажности среды, и с этой опасностью придется считаться при осуществлении запланированных полетов на Луну и Марс. Пешие переходы по сухой поверхности могут вызвать образование огромных зарядов, могущих повредить электронные устройства.

Озонное растрескивание

Статические разряды в присутствии воздуха или кислорода вызывают образование озона. Озон повреждает резиновые детали, в частности, ведет к растрескиванию уплотнителей.

Энергия статического разряда

Высвободившаяся при статических разрядах энергия варьируется в широких пределах. Разряды энергией более 5000 мДж представляют опасность для человека. Один из стандартов предполагает, что предметы потребления не должны создавать разряд с энергией выше 350 мДж на человека. Максимальное напряжение ограничивается значением 35-40 кВ вследствие ограничивающего фактора – коронного разряда. Потенциал ниже 3000В обычно человеком не ощущается. Прохождение пешком 6 метров по полихлорвиниловому линолеуму при влажности воздуха 15% вызывает образование потенциала 12 кВ, в то время как при 80% влажности потенциал не превышает 1,5 кВ.

Искра возникает при энергии выше 0,2 мДж. Искру подобной энергии человек обычно не видит и не слышит. Чтобы произошел взрыв в водороде, достаточно искры с энергией 0,017 мДж, и до 2 мДж для паров углеводородов. Электронные компоненты повреждаются при энергии искры между 2 и 1000 нДж.

Применение статики

Статическое электричество широко используется в ксерографах, воздушных фильтрах, для окраски автомобилей, фотокопировальных устройствах, краскораспылителях, принтерах, и заправке топливом воздушных судов.

Похожие темы:

Немного теории о статическом электричестве

Следовательно, интенсивность проявления этого эффекта напрямую связана с амплитудой статического заряда и расстоянием между притягивающимися или отталкивающимися объектами. Притягивание и отталкивание происходят в направлении силовых линий электрического поля.

Если два заряда имеют одинаковую полярность – они отталкиваются, если противоположную – притягиваются. Если один из объектов заряжен, он будет провоцировать притягивание, создавая зеркальную копию заряда на нейтральных объектах.

3. Риск возникновения пожара

Риск возникновения пожара не является общей для всех производств проблемой. Но вероятность возгорания очень велика на полиграфических и других предприятиях, где используются легковоспламеняющиеся растворители.

В опасных зонах наиболее распространенными источниками возгорания являются незаземленное оборудование и подвижные проводники. Если на операторе, находящемся в опасной зоне, надета спортивная обувь или туфли на токонепроводящей подошве, существует риск, что его тело будет генерировать заряд, способный спровоцировать возгорание растворителей. Незаземленные проводящие детали машин также представляют опасность. Все, что находится в опасной зоне должно быть хорошо заземлено. Нижеследующая информация дает краткое пояснение способности статического разряда провоцировать возгорание в легковоспламеняющихся средах. Важно, чтобы неопытные продавцы были заранее осведомлены о видах оборудования, чтобы не допустить ошибки в подборе устройств для применения в таких условиях.

Способность разряда провоцировать возгорание зависит от многих переменных факторов:

  • типа разряда;
  • мощности разряда;
  • источника и энергии разряда;
  • минимальной энергии воспламенения (МЭВ) легковоспламеняющейся среды;
  • наличия легковоспламеняющейся среды (растворителей в газовой фазе, пыли или горючих жидкостей).

Типы разряда
Существует три основных типа — искровой, кистевой и скользящий кистевой разряды. Коронный разряд в данном случае во внимание не принимается, т.к. он отличается невысокой энергией и происходит достаточно медленно. Коронный разряд чаще всего неопасен, его следует учитывать только в зонах очень высокой пожаро- и взрывоопасности.

Искровой разряд в основном исходит от умеренно проводящего, электрически изолированного объекта. Это может быть тело человека, деталь машины или инструмент. Предполагается, что вся энергия заряда рассеивается в момент искрения. Если энергия выше МЭВ паров растворителя, может произойти воспламенение.

Энергия искры рассчитывается следующим образом: Е (в Джоулях) = 1/2 С U2

Кистевой разряд возникает, когда заостренные части деталей оборудования концентрируют заряд на поверхностях диэлектрических материалов, изоляционные свойства которых приводят к его накоплению. Кистевой разряд отличается более низкой энергией по сравнению с искровым и, соответственно, представляет меньшую опасность в отношении воспламенения.

Скользящий кистевой разряд

происходит на листовых или рулонных синтетических материалах с высоким удельным сопротивлением, имеющих повышенную плотность заряда и разную полярность зарядов с каждой стороны полотна. Такое явление может быть спровоцировано трением или распылением порошкового покрытия. Эффект сравним с разрядкой плоского конденсатора и может представлять такую же опасность, как искровой разряд.

Мощность разряда
Если объект, имеющий энергию, не очень хорошо проводит электрический ток, например, человеческое тело, сопротивление объекта будет ослаблять разряд и понижать опасность. Для человеческого тела существует эмпирическое правило: считать, что любые растворители с внутренней минимальной энергией воспламенения менее 100 мДж могут воспламениться несмотря на то, что энергия, содержащаяся в теле, может быть выше в 2 – 3 раза.

Источник и энергия разряда
Величина и геометрия распределения заряда являются важными факторами. Чем больше объем тела, тем больше энергии оно содержит. Острые углы повышают мощность поля и поддерживают разряды.

Минимальная энергия воспламенения МЭВ
Минимальная энергия воспламенения растворителей и их концентрация в опасной зоне являются очень важными факторами. Если минимальная энергия воспламенения ниже энергии разряда, возникает риск возгорания.

4. Удар электрическим током

Вопросу риска статического удара в условиях промышленного предприятия уделяется все больше внимания. Это связано с существенным повышением требований к гигиене и безопасности труда. Удар током, спровоцированный статическим электричеством, в принципе, не представляет особой опасности. Он просто неприятен, если только не вызывает резкой реакции отклонения от объекта удара.

Существуют две общие причины статического удара.

Наведенный заряд

Если человек находится в электрическом поле и держится за заряженный объект, например, за намоточную бобину для пленки, возможно, что его тело зарядится от наведенной индукции.

Заряд остается в теле оператора, если он находится в обуви на изолирующей подошве, до того момента, пока он не дотронется до заземленного оборудования. Заряд стекает на землю и поражает человека. Такое происходит и в случае, когда оператор дотрагивается до заряженных объектов или материалов – из-за изолирующей обуви заряд накапливается в теле. Когда оператор трогает металлические детали оборудования, заряд может стечь и спровоцировать электроудар.

При перемещении людей по синтетическим ковровым покрытиям порождается статический заряд при контакте между ковром и обувью. Электроудары, которые получают водители, покидая свою машину, провоцируются зарядом, возникшим между сиденьем и их одеждой в момент подъема. Решение этой проблемы – дотронуться до металлической детали автомобиля, например, до рамы дверного проема, до момента подъема с сиденья. Это позволяет заряду безопасно стекать на землю через кузов автомобиля и его шины.

Удар, спровоцированный оборудованием

Такой электроудар возможен, хотя происходит значительно реже, чем поражение, спровоцированное материалом. Если намоточная бобина имеет значительный заряд, случается, что пальцы оператора концентрируют заряд до такой степени, что он достигает точки пробоя, и происходит разряд. Помимо этого, если металлический незаземленный объект находится в электрическом поле, он может зарядиться наведенным зарядом. По причине того, что металлический объект является токопроводящим, подвижный заряд разрядится в человека, который дотрагивается до объекта.

Вернуться к списку для выбора раздела.



VI. Оценка минимального заряда, достаточного для воспламенения опасных атмосфер

При определении эффективности применения антистатического ионизатора ЕХ1250 во взрывоопасной среде может возникнуть вопрос о количественной оценке остаточного статического поля на предмет возможности привести к воспламенению или взрыву в опасной атмосфере, возникающей в производственном процессе.

Увы, на этот вопрос вряд ли есть точный и однозначный ответ, так как степень опасности зависит от того, способен ли накопленный заряд генерировать электрическое поле с достаточным напряжением, чтобы сформировать пробой на материале с последующим разрядом, содержащим энергию, большую, чем минимальная энергия воспламенения горючей атмосферы данного процесса.

Конечно, различные виды разрядов требуют различных условий для их возникновения, например, искровой разряд, кистевой разряд и т.д.

Самый лучший международный источник информации по теме, касающейся статических опасностей — это руководство IEC60079-32-1, но и оно не дает никаких точных значений напряжений, но тем не менее в разделе 7.1.5. «Невоспламеняющие разряды при операциях с жидкостями» утверждает следующее:

Опасность воспламенения может возникнуть при гораздо более низких напряжениях (обычно от 5 до 10 кВ), если изолированные проводники, такие, как плавающие металлические объекты или неправильно закрепленные элементы, находятся в емкости, или если контейнер имеет изолирующую подложку без точки контакта для заземления находящейся в нем жидкости и наполняется жидкостью, которая имеет достаточную проводимость для создания разрядов.

Далее раздел A.3. «Электростатические разряды» дает описание статического разряда:

А.3.2. Искры

Искра — это разряд между двумя проводниками, жидкими или твердыми. Она характеризуется ярко выраженным световым каналом разряда, несущим ток высокой плотности. Газ ионизирован на всю длину канала. Разряд очень быстрый и вызывает резкий треск.

Искра происходит между двумя проводниками, когда напряженность поля между ними превышает электрическую напряженность атмосферы. Разница потенциалов между проводниками, необходимая для пробоя, зависит как от формы так и от расстояния между проводниками. Для сравнения: напряженность пробоя для поверхностей плоских или с большим радиусом искривления при расстоянии 10 мм или более между ними составляет 3 МВм

-1 (300 В на мм) в нормальном воздухе и увеличивается при увеличении расстояния.

Поскольку объекты, между которыми проскакивает искра, являются проводниками, преобладающая часть сохраненного заряда проходит через искру. В большинстве случаев на практике это рассеивает почти всю сохраненную энергию. Энергия искры между проводящим телом и проводящим заземленным объектом может быть вычислена по следующей формуле:

W = ½ Q V = ½ C V

2,

где

  • W — рассеянная энергия в джоулях,
  • Q — количество заряда на проводнике в кулонах,
  • V — его потенциал в вольтах,
  • C — его емкость в фарадах.

Результатом расчета является максимальное количество энергии. Энергия искры будет меньше, если есть сопротивление в пути разряда на заземление. Типичные значения емкостей проводников даны в таблице ниже:

Таблица А.2 Значения емкостей типичных проводников
ОбъектЕмкость в пФ
(1 пФ = 1х10-12 Ф)
Мелкие металлические предметы (наконечник шланга, ковш)от 10 до 20
Малые контейнеры (корзина, барабан до 50 л)от 10 до 100
Средние контейнеры (250 — 500 л)от 50 до 300
Крупные объекты (реакторы, окруженные заземленными структурами)от 100 до 1000
Тело человекаот 100 до 200

Исходя из того, что искра может возникать как между жидкими, так и твердыми проводниками, мы можем принять в качестве примерной оценки нижнего порога для разряда в 5-10 кВ, что очень приблизительно и не учитывает ни форму проводников, ни состав и концентрацию газовой смеси.

Также в заключение можно сказать, что фактическая возможность пожара или взрыва всегда зависит не только от напряжения, но и емкости проводника и минимальной энергии воспламенения окружающей атмосферы данного производственного процесса.

Вернуться к списку для выбора раздела.

Статическое электричество: опасность и меры защиты. Часть 1

Интенсивность возникновения зарядов в технологическом оборудовании определяется физико-химическими свойствами перерабатываемых веществ и материалов, из которых изготовлено оборудование, а также параметрами технологического процесса.

В случае разности потенциалов 300 В искровой разряд способен воспламенить почти все горючие газы, а когда разность потенциалов достигнет 5000 В, то и большую часть горючих пылей.

Так, например, при движении приводного ремня со скоростью 15 м/с разряд может достичь 80 кВ (при движении прорезиненной ленты транспортера — до 45 кВ, протекании бензина по стальным трубам — до 3,6 кВ). При движении автомобиля по бетонной дороге — до 3 кВ (вследствие скольжения колес и ударов частиц песка и гравия о металлические части кузова).

Искра, возникшая из-за разряда статического электричества, явилась, возможно, тем последним доводом, который окончательно склонил чашу весов в пользу самолетов в их споре с дирижаблями за господство в воздухе в конце 30-х годов прошлого века. Во всяком случае, попытки использования дирижаблей в качестве пассажирского воздушного транспорта прекратились как раз после гибели гигантского дирижабля от пожара, вызванного электрическим разрядом (г. Нью-Йорк, 1937 г.). Однако и самолеты подвержены воздействию статического электричества, возникающего на них в результате взаимодействия с жидкими и твердыми частицами облаков и осадков.

С увеличением скорости самолетов острота данной проблемы только возрастала: выяснилось, что ток, заряжающий самолет при полете в облаках и осадках, растет с увеличением скорости значительно сильнее, чем разряжающий ток. На самолетах наблюдались электрические разряды разных форм и связанные с этим явлением электромагнитные помехи и повреждения элементов конструкции. При заряжении самолета статическим электричеством резко возросла опасность поражения его молнией. По имеющимся оценкам, вероятность прямого поражения самолета молнией во время полета в грозовом облаке составляет 10-4, т.е. из 10000 пролетов через облако молния в одном случае почти всегда попадает в самолет. Когда самолет электрически заряжен, эта вероятность на два порядка выше: один случай поражения молнией приходится уже на 100 пролетов через облако. Заряженный самолет, таким образом, инициирует молнию, вызывая разряд атмосферного электричества на себя. Это не удивительно, если учесть, что потенциал самолета относительно окружающей среды может достигать полутора миллионов вольт!

Также известны случаи, когда по причине электростатических разрядов происходили серьезные аварии и пожары на технологических установках нефтепереработки, резервуарах и емкостях с горючими жидкостями и газами (Россия, Япония), отмечались жалобы персонала на неприятные ощущения и ухудшение самочувствия в работе.

 

Защита от статического электричества

 

В каждой организации в соответствующие технологические инструкции или инструкции по охране труда, видам работ и пожарной безопасности должны быть включены пункты по защите от статического электричества и эксплуатации устройства защиты от статического электричества.

Опасность действия статического электричества должна устраняться специальными мерами, которые создают утечку электростатических зарядов, предотвращающих накопление энергии заряда выше уровня 0,4 А/мин, или создают условия, исключающие возможность образования взрывоопасной концентрации взрывоопасной смеси (например, вытеснение горючей смет инертным газом).

откуда берется статическое электричество и как от него избавиться – Москва 24, 14.09.2015

Иллюстрация: Полина Бреева

Статическое электричество – это явление, спровоцированное появлением или исчезновением избыточного напряжения на поверхности или внутри материалов, не проводящих электрический ток (стекла, пластика и других). Их называют диэлектриками, в их молекулярной структуре почти отсутствуют свободные электроны. Как появляется этот эффект и каким образом с ним можно бороться, объяснили наши друзья из Детского центра научных открытий «ИнноПарк».

Статическое электричество появляется из-за нарушения равновесия внутри атома или молекулы. На внешних орбиталях образуется избыточное количество электронов либо их, наоборот, становится недостаточно. Наиболее распространенная причина нарушения этого равновесия – трение. Даже самая гладкая, зеркальная поверхность имеет микровыступы, неровности, шероховатости. Трение есть всегда и в любых средах: твердой, жидкой и газообразной.

Резкий перепад температур также может стать причиной электризации. Происходит изменение скорости движения и, соответственно, количества столкновений или колебаний атомов внутри кристаллической решетки или молекулы. Как следствие – спонтанное отделение электронов, которые могут скапливаться, тем самым создавая статический заряд.

В быту мы часто сталкиваемся с этим эффектом. Когда мы ходим по ковру, мы являемся носителями отрицательного заряда, а ворсинки у нас под ногами – положительного. Как только мы после такой прогулки возьмем в руки ключи, накопленное напряжение мгновенно разрядится и нас слегка тряхнет.

Особенно настойчиво статическое электричество преследует нас в холодное время года. Зимой низкая влажность, а на человеке больше одежды. Сухость плюс много диэлектриков – плодотворная среда для электризации. На шерстяном свитере и синтетической кофте хорошо скапливаются заряды. Бояться нечего, небольшие разряды статического электричества не могут нанести вреда человеку.

Если вам все же неприятно, вот несколько практических рекомендаций:

Ссылки по теме

1проложите хлопковой тканью стопки бумаги, пластика или синтетики;

2распыляйте на ковры антистатик;

3смазывайте волосы специальными средствами и выбирайте фен со встроенным ионным излучателем;

4если у вас в квартире кондиционер, дополните его увлажнителем воздуха;

5брейте ноги, это серьезно уменьшает риск скопления заряда.

Если приемы не сработали, есть способ быстро избавиться от напряжения. Одной рукой коснитесь заземленной поверхности – трубы или радиатора отопления, а в другой сожмите металлический предмет – скажем, связку ключей.

Елена Стрижакова, Детский центр научных открытий «ИнноПарк»

О «Физике города»

Каждый день, просыпаясь утром, мы погружаемся в город, полный фактур, звуков и красок. Пока мы идем на работу и гуляем в парке, нам в голову приходит миллион вопросов о том, как же все вокруг нас устроено в этом огромном мегаполисе. Почему под нами дрожит земля, когда под нами проезжает поезд метро? И может ли в Москве произойти землетрясение? Какими видят нас люди из космоса?

Мы предложили коллегам из Детского центра научных открытий «ИнноПарк» дать ответы на наши вопросы и разъяснить, сколько велосипедистов нужно для освещения столицы, какие оптические иллюзии можно увидеть в городе и как начать экономить энергию, не выходя из дома. Так появился проект «Физика города». Новые вопросы и новые ответы ищите на нашем сайте по понедельникам и четвергам.

Статическое электричество

Со статическим электричеством сталкивался каждый, когда после длительного расчесывания волосы разлетаются в разные стороны. Еще одним типичным примером статического электричества будет снятие одежды в темной комнате, в таких случаях можно видеть явление схожее даже с разрывом небольшой молнии.

Итак, что же такое статическое электричество? С физической точки зрения, статическим электричеством называется потеря предметом внутриатомного равновесия вследствие потери одного электрона или же его приобретения. Одним словом, статическим электричеством называют самостоятельно возникающий электрический заряд, чаще всего это связано с трением одной поверхности об другую.

Причиной явления становится трение или же соприкосновение двух разнородных веществ диэлектриков. В этом случае атомы одного из веществ отрывают электроны другого. Между двумя телами возникает разность потенциалов. После того как тела разъединятся, каждое сохранит свой заряд, а разность потенциалов возрастет.
Статическое электричество не наблюдается при влажности воздуха, превышающей 85%. Дело в том, что в этом случае электрические разряды не могут нейтрализоваться.


Физическая природа статического электричества


Можно теоретически рассчитать вероятность возникновения статического электричества, для этого используется Трибоэлектрическая шкала. Чем выше располагается материал на шкале, тем сильнее он заряжается. В верхней части шкалы располагаются материалы с положительными зарядами, а в нижней с отрицательными. Действует и другая закономерность, чем больше разнесены между собой материалы, тем более мощным станет заряд. Так в верхней части шкалы располагается воздух и руки человека, а в нижней янтарь и хлопок, т.е. максимально мощный заряд возникнет при контакте человеческой руки и хлопка.


Эти знания, прежде всего, имеют практическое применение. Так как именно статическое электричество может стать причиной мощного возгорания на производстве. Результаты могут быть самыми непредсказуемыми: от взрыва бензина в бензобаке и до взрыва танкера или пыли в угольной шахте. Более того, взрыв может вызвать даже мучная пыль на мельнице.

Влияние на организм человека 

Разумеется, человека в значительно большей мере волнует бытовая составляющая явления, так как далеко не все работают на производстве.

Итак, способность накапливать положительные заряды характеризуются все части тела человека, начиная с кожи и волос. Возникновение статического заряда становится возможным при любом контакте с полимером. Главная проблема – негативное влияние заряда на здоровье человека.

Человек становится носителем электрического заряда в случае длительного контакта с наэлектризованными предметами. В этом случае он становится своего рода сосудом, набирающим жидкость, а каждая капля может стать уже последней.

Так, если человек спит, статическое электричество проявляет себя в раздражении нервных окончаний на коже. У человека меняется сосудистый тонус, наблюдаются системные сдвиги, могут возникнуть отклонения в работе нервной системы, повышается утомляемость, а сон не приносит облегчения.

Статическое электричество в быту не формирует мощных зарядов, однако может вызывать неприятности со здоровьем. В то время как на производстве статическое электричество может стать причиной серьезной аварии. Вот почему знания о его природе и механизме возникновения необходимы каждому.

Читайте также — короткое замыкание

  • Просмотров: 3217
  • Статическое электричество: защита, возникновение — Asutpp

    Люди постоянно сталкиваются со статическим электричеством, точнее с его проявлениями (в своей квартире, в автомобиле, на производстве и т.д.). Однако не многие из нас всерьез задумывались о природе его возникновения,  физических свойствах, характеристиках,  средствах защиты от статического электричества. Настоящая статья посвящена поиску ответов на перечисленные вопросы.

    Что такое статическое электричество

    Для молекулы или атома любого вещества нормальным является равновесное состояние, т.е. число положительных (протонов) и отрицательных (электронов) частиц в атоме одинаково. Но электроны вещества могут легко (у разных материалов по разному) перемещаться от одного атома к другому, тем самым формируя положительный (недостающий электрон) или отрицательный (избыточные электрон) заряд атома. Именно такой дисбаланс в атомах и молекулах формирует статическое электрополе. Такие поля нестабильны и при первой же возможности разряжаются.

    ГОСТ 17.1.018-79 “Статическое электричество. Искробезопастность» трактует термин «статическое электричество» как способность свободных электрических зарядов возникать, сохраняться и релаксировать в объеме и на поверхности полупроводников и диэлектриков.
    Обязательным «спутником» статического поля является сухой воздух. При влажности выше 80% такие поля практически никогда не формируют т.к. вода является отличным проводником и не позволяет избыточному электричеству накапливаться на поверхности материалов.

    Источники возникновения статического поля и причины его генерирования

    Все мы помним со школьного курса физики опыт с эбонитовым стержнем, или пластмассовой расческой и куском шерстяной ткани. После натирания стержня тканью он был способен притягивать к себе мелко нарезанные кусочки бумаги.

    Опыт с эбонитовым стержнем

    Трение двух поверхностей является самым распространенным источников возникновения статического поля. Необязательно тереть два материала друг о друга. Статическое поле может возникнуть при одиночном контакте, к примеру, в случае наматывания/разматывания тканевой ленты.

    Также источниками генерирования статического поля могут служить:

    • Резкие температурные перепады;
    • Высокий уровень радиации.

    Статическое поле может быть «самоприобретенным» и «наведенным», т.е. полученным от другого сильно наэлектризованного объекта без непосредственного контакта с ним. Такой метод «принудительной электризации» называют индукцией.

    Всем нам хорошо известен электрический треск при снятии верхней одежды или «электрический удар» от кузова автомобиля. Мы наблюдаем и нередко испытываем на себе действие статических разрядов при расчесывании волос, нарезании бумаги, переливании бензина и т.д.

    Обязательным условием для генерирования статического электрополя является наличие магнитных полей. Таким образом, следует констатировать, что свободные заряды окружают нас постоянно. Но человеку этого мало и он активно использует в своей повседневной жизни и работе огромное количество различных электрических устройств, тем самым только увеличивая общую «электрическую напряженность» среды обитания.

    Сфера использования

    Электростатические приборы и устройства, принцип действия которых основывался на трении, так и не смогли покинуть лабораторных полок и учебных, где они, преимущественно, используются в качестве демонстрационного материала.

    Попытки использовать статические поля для генерации электрического тока тоже не принесло особых успехов. Генераторы Ван Дер Граафа и Феличи, которые были созданы в 30-ом и 40-ом году прошлого столетия, тоже не нашли себе широкого применения, т.к. это оборудование было достаточно громоздко.

    Генераторы Ван Дер Граафа

    К тому же их функционирование и техническое обслуживание обходилось очень дорого.

    Очень полезным с точки зрения промышленного применения, оказалось открытие коронного разряда, который широко применяется в различных областях промышленности. В частности, с его помощью, можно очищать газы от различных примесей и наносить краску на поверхность любой конфигурации.

    Проблемы, связанные со статическим электричеством

    Значительно большее внимание сегодня уделяется проблемам, которые являются прямым следствием накопленного электростатического напряжения. Электроудары различной мощности могут поражать человека, как в домашних условиях, так и на работе.

    Статическое электричество в быту

    К примеру, свитер из синтетической ткани, в результате трения со спинкой кресла или с материалом верхней одежды, способен накапливать разряд, который «даст о себе знать» при его снимании. Гораздо мощнее бьет при прикосновения к кузову автомобиля, который наэлектризовался от трения об воздух.

    Любой электрический прибор, будь то кухонный комбайн, ноутбук, монитор компьютера или пылесос, обязательно несет в себе электростатический заряд, который «охотно» переходит в человека при контакте. Такой «переход» может вызывать, а может и не вызывать болезненные ощущения, но он однозначно вреден для человеческого организма.

    Ученые давно доказали, что воздействие энергии статического электричества представляет опасность для здоровья человека, в частности для сердечно-сосудистой и центральной нервной системы.

    Защита

    В упоминаемом ранее, ГОСТе детально рассматриваются способы защиты от влияния статических полей, самым простым из которых является надежное заземление оборудования.

    Что можно сделать защиты от статических полей помещений частного дома и промышленных помещений?

    Видео: как избавиться от статического электричества.
    https://www.youtube.com/watch?v=ls-hBlqJu9Y

    Для защиты людей и высокоточного оборудования от воздействия статического электричества на производстве используют специальные экраны и другие электромеханические приспособления. Для подавления электризации в жидких полимерах применяют специальные присадки и растворители. Широко используются в качестве для защиты от статического электричества в быту и на производстве различные антистатики.

    Антистатическая спец. одежда

    Это химические вещества, имеющие низкую молекулярную массу, что позволяет их молекулам легко перемещаться и, в дополнение к этому, вступать реакцию с атмосферной влагой. Совокупность этих характеристик позволяет им рассеивать очаги возникновения статических полей и снимать статистическое напряжение с человека.

    Что такое мощность? | Учитель статистики

    Анджела Л.Э. Уолмсли и Майкл С. Браун, Университет Конкордия, штат Висконсин,

    Для многих учителей вводной статистики понятие мощности часто не используется. Во многих случаях этого вообще избегают. Фактически, многие преподаватели Advanced Placement (AP) избегают этой темы, когда преподают тесты значимости, согласно Флойду Булларду в книге «Сила в тестах значимости». Тем не менее, власть является важным понятием, которое следует понимать как потребителю исследований, независимо от того, в какую область или профессию студент может войти, став взрослым.Следовательно, обсуждение власти должно быть включено во вводный курс.

    Чтобы обсудить и понять власть, нужно четко понимать концепции ошибок типа I и типа II. В весеннем выпуске журнала Statistics Teacher Network Дуг Раш (Doug Rush) обновляет информацию об ошибках типа I и типа II (включая мощность и величину эффекта), но, вкратце, ошибка типа I отвергает нулевую гипотезу в пользу ложной. альтернативная гипотеза, а ошибка типа II не может отвергнуть ложную нулевую гипотезу в пользу истинной альтернативной гипотезы.Вероятность ошибки типа I обычно называется альфа, а вероятность ошибки типа II обычно называется бета.

    Теперь к власти. Многим учащимся необходимо познакомиться с различными точками зрения на определение власти. Буллард описывает несколько способов правильно интерпретировать власть:

    • Мощность — это вероятность отклонения нулевой гипотезы, когда на самом деле она ложна.
    • Мощность — это вероятность принятия правильного решения (отклонить нулевую гипотезу), когда нулевая гипотеза ложна.
    • Мощность — это вероятность того, что проверка значимости обнаружит присутствующий эффект.
    • Мощность — это вероятность того, что проверка значимости обнаружит отклонение от нулевой гипотезы, если такое отклонение существует.
    • Мощность — это вероятность избежать ошибки типа II.

    Проще говоря, мощность — это вероятность не совершить ошибку типа II, согласно Нилу Вайссу в Introductory Statistics .

    Математически степень равна 1 — бета.Мощность проверки гипотез составляет от 0 до 1; если степень близка к 1, проверка гипотезы очень хорошо обнаруживает ложную нулевую гипотезу. Бета обычно устанавливается на 0,2, но исследователи могут установить меньшее значение.

    Следовательно, мощность может быть как 0,8, так и выше. Степень ниже 0,8, хотя и возможна, обычно считается слишком низкой для большинства областей исследований.

    Буллард также утверждает, что на мощность влияют следующие четыре основных фактора:

    1. Уровень значимости (или альфа)
    2. Размер выборки
    3. Вариабельность или дисперсия измеряемой переменной отклика
    4. Величина влияния переменной

    Мощность увеличивается, когда исследователь увеличивает размер выборки, а также когда исследователь увеличивает размер эффекта и уровни значимости.Существуют и другие переменные, которые также влияют на мощность, включая дисперсию ( σ2 ), но мы ограничим наш разговор отношениями между мощностью, размером выборки, размером эффекта и альфа для этого обсуждения.

    На самом деле исследователь хочет, чтобы ошибки типа I и типа II были небольшими. С точки зрения уровня значимости и мощности, по словам Вайсс, это означает, что нам нужен небольшой уровень значимости (близкий к 0) и большой уровень (близкий к 1).

    Немного изложив концепцию силы, авторы пришли к выводу, что для учащихся наиболее важно понимать важность силы, связанной с размером выборки, при анализе исследования или исследовательской статьи по сравнению с фактическим расчетом мощности.Мы обнаружили, что студенты в целом понимают концепции выборки, дизайна исследования и основных статистических тестов, но иногда борются с важностью силы и необходимого размера выборки. Таким образом, диаграмма на Рисунке 1 представляет собой инструмент, который может быть полезен при ознакомлении с концепцией власти в статистике обучения аудитории или при необходимости углубить понимание методологии исследования.

    Рис. 1 Инструмент, который может быть полезен при ознакомлении с концепцией власти в статистике обучения аудитории или при необходимости углубить понимание методологии исследования

    Эта концепция также важна для учителей, чтобы они могли развить собственное понимание статистики.Этот инструмент может помочь студенту критически проанализировать, имеет ли исследование или статья, которую они читают и интерпретируют, приемлемую мощность и размер выборки, чтобы минимизировать ошибку. Вместо того чтобы концентрироваться только на результате со значением p , который так часто был в центре внимания, эта диаграмма (и приведенные ниже примеры) помогают учащимся понять, как рассматривать мощность, размер выборки и размер эффекта в сочетании с p -значение при анализе результатов исследования. Мы рекомендуем использовать эту таблицу, чтобы помочь вашим ученикам понять и интерпретировать результаты, когда они изучают различные исследования или методологии.

    Примеры использования диаграммы

    Представьте шесть вымышленных примеров исследований, каждое из которых проверяет, может ли новое приложение под названием StatMaster помочь учащимся изучать статистические концепции лучше, чем традиционные методы. Каждое из шести исследований проводилось с участием старшеклассников, сравнивая утренний класс AP Statistics (35 студентов), в котором было установлено приложение StatMaster, с дневным классом AP Statistics (35 студентов), которые не использовали приложение StatMaster. Результатом каждого из этих исследований было сравнение средних результатов тестов между утренними и дневными занятиями в конце семестра.

    Статистическая информация и фиктивные результаты показаны для каждого исследования (A – F) на Рисунке 2, при этом основная информация выделена жирным курсивом. Хотя эти шесть примеров относятся к одному и тому же дизайну исследования, не сравнивайте сфабрикованные результаты различных исследований. Это шесть независимых вымышленных примеров, иллюстрирующих применение диаграммы.

    Рисунок 2 Шесть вымышленных примеров исследований, каждое из которых проверяет, может ли новое приложение под названием StatMaster помочь учащимся изучать статистические концепции лучше, чем традиционные методы (щелкните, чтобы увеличить)

    В исследовании Study A ключевым элементом является значение p , равное 0.034. Поскольку это значение альфа меньше 0,05, результаты статистически значимы, и мы можем остановиться на синем значке остановки в поле СТАРТ. Хотя в исследовании все еще существует риск ошибки типа I, этот результат не оставляет открытой возможности ошибки типа II. Другими словами, мощность достаточна для обнаружения различия, потому что они действительно обнаружили статистически значимое различие. Не имеет значения, что не производится вычисление мощности или размера выборки, если значение p меньше альфа.

    В исследовании Study B резюме те же, за исключением p — значения 0,383. Поскольку это значение больше, чем альфа 0,05, мы перемещаемся по диаграмме в большое среднее поле, чтобы проверить наличие или отсутствие приемлемой ошибки типа II. В этом случае соблюдены критерии верхнего левого поля (отсутствие размера выборки или расчета мощности), и, следовательно, отсутствие статистически значимой разницы может быть связано с неадекватной мощностью (или истинным отсутствием разницы, но мы не можем исключить недостаточную мощность).Нажимаем верхний левый красный СТОП. Поскольку недостаточная мощность — или чрезмерный риск ошибки типа II — возможна, сделать вывод об эффективности StatMaster статистически невозможно.

    В исследовании Study C снова значение p больше альфа, что возвращает нас ко второму основному блоку. В отличие от исследования B, наличие желаемой мощности и расчета размера выборки позволяет нам избежать красного СТОП в верхнем левом квадранте, но мощность 70% оставляет нам соответствие критериям верхнего правого красного СТОП.При мощности 70% наш порог потенциальной ошибки типа II составляет 30% (1-0,7), что выше традиционно приемлемых 20%. Возможность сделать статистический вывод относительно StatMaster затруднена из-за возможности недопустимо высокого риска ошибки типа II.

    В исследовании Study D значение p по-прежнему превышает альфа, но — в отличие от исследования B и исследования C — исследование D имеет соответствующую мощность, установленную на уровне 80%. Это хорошо. Задача состоит в том, чтобы размер выборки соответствовал этой 80% мощности.В исследовании D говорится, что для уверенности в 80% мощности требуется 40 человек в каждом классе, но в исследовании участвуют только 35 человек, поэтому мы нажимаем красный СТОП в нижнем левом квадранте. Поскольку желаемый размер выборки не был соблюден, фактическая мощность составляет менее 80%, что фактически оставляет нас в той же ситуации, что и в исследовании C — с риском чрезмерной ошибки типа II, превышающей 20%.

    В исследовании Study E задачи более сложные. Имея значение p больше альфа, мы снова переходим к среднему большому квадрату, чтобы исследовать потенциал чрезмерной или неопределенной ошибки типа II.В этом случае достаточны мощность (80%), альфа (0,05) и размер выборки (35 в каждой когорте). Однако размер эффекта установлен на 50%.

    Хотя изменение оценки на 50% было бы интересным, у него есть две проблемы. Во-первых, вполне вероятно, что предыдущие предложения курсов дают некоторую оценку производительности в отсутствие StatMaster, и, если предположить, что это даже отдаленно близко к среднему значению 85%, наблюдаемому в исследовании E, увеличение на 50% математически невозможно, что делает это непрактичный эффект размера.Во-вторых, размер выборки обеспечит достаточную мощность для обнаружения размера эффекта, который составляет , по крайней мере, такой же большой, как желаемый размер эффекта, или больше, но не меньше . Рассмотрение уравнения ранее в этой рукописи дает математическое подтверждение этой концепции.

    Таким образом, хотя размер эффекта в 50% был бы впечатляющим — в отсутствие статистически значимого результата — исследование E , а не было бы определенно обладало достаточной мощностью для обнаружения меньшего размера эффекта, даже если на меньший размер эффекта может быть интересно.Таким образом, мы остались у красного знака СТОП в правом нижнем углу.

    Обратите внимание, что, в отличие от других красных знаков СТОП, этот пример требует субъективной оценки и менее объективен, чем три других пути к потенциально превышающей допустимой ошибке типа II. Как отмечалось ранее, это сложный и трудный для интерпретации сценарий, но он вполне правдоподобен (даже распространен) и поэтому включен для рассмотрения.

    Наш последний пример — Исследование F, в котором мы можем перейти к блоку, описывающему размер выборки и мощность как приемлемые.Мощность (80%), желаемый размер эффекта (изменение 5%) и альфа (0,05) являются подходящими, и желаемый размер выборки (35 в каждой когорте) был соблюден, что привело нас к статистическому заключению, что отсутствие статистически значительный результат показывает, что никакой разницы не существует. Признайте, что вероятность ошибки типа II все еще существует, но она не превышает 1 — степень — или, в данном случае, 20% (1–0,8) — вот почему она считается приемлемой.

    В заключение мы призываем учителей познакомить с концепцией власти и ее важностью при оценке статистических исследований.Мы надеемся, что как примерные сценарии, так и блок-схема будут полезны как для учителей, так и для учащихся, поскольку они исследуют концепцию силы и ее связь с размером эффекта, размером выборки и уровнем значимости в целом.

    Нежное введение в статистическую мощность и анализ мощности в Python

    Последнее обновление 24 апреля 2020 г.

    Статистическая мощность проверки гипотезы — это вероятность обнаружения эффекта, если существует истинный эффект, который необходимо обнаружить.

    Мощность

    может быть рассчитана и представлена ​​для завершенного эксперимента, чтобы прокомментировать степень уверенности в выводах, сделанных на основе результатов исследования. Его также можно использовать в качестве инструмента для оценки количества наблюдений или размера выборки, необходимых для обнаружения эффекта в эксперименте.

    В этом руководстве вы откроете для себя важность статистической мощности проверки гипотез, а теперь сможете рассчитать анализ мощности и кривые мощности как часть экспериментального плана.

    После прохождения этого руководства вы будете знать:

    • Статистическая мощность — это вероятность того, что проверка гипотезы обнаружит эффект, если эффект будет обнаружен.
    • Анализ мощности может использоваться для оценки минимального размера выборки, необходимого для эксперимента, с учетом желаемого уровня значимости, размера эффекта и статистической мощности.
    • Как рассчитать и построить график анализа мощности для t-критерия Стьюдента на Python, чтобы эффективно спланировать эксперимент.

    Начните свой проект с моей новой книги «Статистика для машинного обучения», включающей пошаговых руководств и файлов исходного кода Python для всех примеров.

    Приступим.

    Нежное введение в статистическую мощность и анализ мощности в Python
    Фотография Камила Порембинского, некоторые права защищены.

    Обзор учебного пособия

    Это руководство разделено на четыре части; их:

    1. Статистическая проверка гипотез
    2. Что такое статистическая мощность?
    3. Анализ мощности
    4. Анализ мощности теста Стьюдента

    Нужна помощь со статистикой для машинного обучения?

    Пройдите бесплатный 7-дневный ускоренный курс электронной почты (с образцом кода).

    Нажмите, чтобы зарегистрироваться, а также получите бесплатную электронную версию курса в формате PDF.

    Загрузите БЕСПЛАТНЫЙ мини-курс

    Статистическая проверка гипотез

    Проверка статистической гипотезы делает предположение о результате, называемое нулевой гипотезой.

    Например, нулевая гипотеза для теста корреляции Пирсона состоит в том, что нет никакой связи между двумя переменными. Нулевая гипотеза для t-критерия Стьюдента состоит в том, что между средними значениями двух популяций нет разницы.

    Тест часто интерпретируется с использованием p-значения, которое представляет собой вероятность наблюдения результата при условии, что нулевая гипотеза верна, а не наоборот, как это часто бывает с неверными интерпретациями.

    • p-value (p) : Вероятность получения результата, равного или более экстремального, чем наблюдалось в данных.

    При интерпретации p-значения теста значимости вы должны указать уровень значимости, часто называемый греческой строчной буквой альфа (а).Обычное значение уровня значимости 5%, записанное как 0,05.

    Значение p интересует контекст выбранного уровня значимости. Результат теста значимости считается « статистически значимым », если p-значение меньше уровня значимости. Это означает, что нулевая гипотеза (об отсутствии результата) отклоняется.

    • p <= alpha : отклонить H0, другое распределение.
    • p> alpha : не удалось отклонить H0, такое же распределение.

    Где:

    • Уровень значимости (альфа) : Граница для определения статистически значимого результата при интерпретации p-значения.

    Мы видим, что p-значение — это просто вероятность, и что на самом деле результат может быть другим. Тест мог ошибиться. Учитывая p-значение, мы можем сделать ошибку в нашей интерпретации.

    Есть два типа ошибок; их:

    • Ошибка типа I . Отвергните нулевую гипотезу, если на самом деле нет значительного эффекта (ложноположительный результат).Значение p оптимистично мало.
    • Ошибка типа II . Не отвергать нулевую гипотезу при значительном эффекте (ложноотрицательный). Значение p пессимистично велико.

    В этом контексте мы можем думать об уровне значимости как о вероятности отклонения нулевой гипотезы, если бы она была верной. Это вероятность возникновения ошибки типа I или ложного срабатывания.

    Что такое статистическая мощность?

    Статистическая мощность или мощность теста гипотезы — это вероятность того, что тест правильно отклоняет нулевую гипотезу.

    То есть вероятность истинно положительного результата. Это полезно только в том случае, если нулевая гипотеза отклонена.

    … статистическая мощность — это вероятность того, что тест правильно отклонит ложную нулевую гипотезу. Статистическая мощность имеет значение только тогда, когда нуль ложен.

    — стр. 60, Основное руководство по размерам эффекта: статистическая мощность, метаанализ и интерпретация результатов исследований, 2010 г.

    Чем выше статистическая мощность для данного эксперимента, тем ниже вероятность ошибки типа II (ложноотрицательный).Тем выше вероятность обнаружения эффекта при наличии эффекта. Фактически, мощность в точности обратна вероятности ошибки типа II.

    Power = 1 — ошибка типа II Pr (истинно положительный) = 1 — Pr (ложно отрицательный)

    Power = 1 — Ошибка типа II

    Pr (True Positive) = 1 — Pr (False Negative)

    Более интуитивно, статистическая мощность может рассматриваться как вероятность принятия альтернативной гипотезы, когда альтернативная гипотеза верна.

    При интерпретации статистической мощности мы ищем экспериментальные установки, обладающие высокой статистической мощностью.

    • Низкая статистическая мощность : Большой риск совершения ошибок типа II, например ложноотрицательный.
    • Высокая статистическая мощность : Небольшой риск совершения ошибок типа II.

    Экспериментальные результаты со слишком низкой статистической мощностью приведут к неверным выводам о значении результатов. Следовательно, необходимо стремиться к минимальному уровню статистической мощности.

    Обычно проводят эксперименты со статистической мощностью 80% или выше, например 0,80. Это означает 20% вероятность столкновения с областью типа II. Это отличается от 5% вероятности возникновения ошибки типа I для стандартного значения уровня значимости.

    Анализ мощности

    Статистическая мощность — это одна часть головоломки, состоящая из четырех связанных частей; их:

    • Размер эффекта . Количественная оценка результата, присутствующего в популяции.Величина эффекта рассчитывается с использованием определенного статистического показателя, такого как коэффициент корреляции Пирсона для взаимосвязи между переменными или d Коэна для разницы между группами.
    • Объем выборки . Количество наблюдений в выборке.
    • Значение . Уровень значимости, используемый в статистическом тесте, например альфа. Часто устанавливается на 5% или 0,05.
    • Статистическая мощность . Вероятность принятия альтернативной гипотезы, если она верна.

    Все четыре переменные связаны. Например, больший размер выборки может облегчить обнаружение эффекта, а статистическая мощность может быть увеличена в тесте за счет увеличения уровня значимости.

    Анализ мощности включает оценку одного из этих четырех параметров с учетом значений трех других параметров. Это мощный инструмент как при планировании, так и при анализе экспериментов, которые мы хотим интерпретировать, используя статистические проверки гипотез.

    Например, статистическая мощность может быть оценена с учетом размера эффекта, размера выборки и уровня значимости.С другой стороны, размер выборки можно оценить с учетом различных желаемых уровней значимости.

    Анализ мощности отвечает на такие вопросы, как «сколько статистической мощности имеет мое исследование?» и «какой размер выборки мне нужен?».

    — стр. 56, Основное руководство по размерам эффекта: статистическая мощность, метаанализ и интерпретация результатов исследований, 2010 г.

    Возможно, наиболее распространенное использование анализа мощности — это оценка минимального размера выборки, необходимой для эксперимента.

    Анализ мощности обычно выполняется перед проведением исследования. Перспективный или априорный анализ мощности можно использовать для оценки любого из четырех параметров мощности, но чаще всего он используется для оценки требуемых размеров выборки.

    — стр. 57, Основное руководство по размерам эффекта: статистическая мощность, метаанализ и интерпретация результатов исследований, 2010 г.

    Как практик, мы можем начать с разумных значений по умолчанию для некоторых параметров, таких как уровень значимости 0.05 и уровень мощности 0,80. Затем мы можем оценить желаемый минимальный размер эффекта, специфичный для проводимого эксперимента. Затем можно использовать анализ мощности для оценки минимального необходимого размера выборки.

    Кроме того, можно выполнить несколько анализов мощности, чтобы получить кривую зависимости одного параметра от другого, например, изменение размера эффекта в эксперименте при изменении размера выборки. Можно создать более сложные графики, варьируя три параметра. Это полезный инструмент для экспериментального дизайна.

    Анализ мощности t-теста Стьюдента

    Мы можем конкретизировать идею статистической мощности и анализа мощности с помощью рабочего примера.

    В этом разделе мы рассмотрим t-критерий Стьюдента, который представляет собой тест статистической гипотезы для сравнения средних значений из двух выборок гауссовских переменных. Предположение или нулевая гипотеза теста состоит в том, что выборочные совокупности имеют одинаковое среднее значение, например что нет никакой разницы между выборками или что выборки взяты из одной и той же основной совокупности.

    Тест вычислит p-значение, которое можно интерпретировать в зависимости от того, являются ли образцы одинаковыми (не удалось отклонить нулевую гипотезу) или существует статистически значимая разница между выборками (отклонить нулевую гипотезу). Обычный уровень значимости для интерпретации p-значения составляет 5% или 0,05.

    • Уровень значимости (альфа) : 5% или 0,05.

    Размер эффекта от сравнения двух групп может быть определен количественно с помощью меры размера эффекта.Распространенной мерой для сравнения разницы в средних значениях двух групп является мера Коэна. Он вычисляет стандартную оценку, которая описывает разницу в количестве стандартных отклонений, когда средние значения различаются. Большой размер эффекта для d Коэна составляет 0,80 или выше, как это обычно принято при использовании этой меры.

    • Размер эффекта : d Коэна не менее 0,80.

    Мы можем использовать значение по умолчанию и принять минимальную статистическую мощность 80% или 0.8.

    • Статистическая мощность : 80% или 0,80.

    Для данного эксперимента с этими значениями по умолчанию нас может заинтересовать оценка подходящего размера выборки. То есть, сколько наблюдений требуется от каждой выборки, чтобы, по крайней мере, обнаружить эффект 0,80 с вероятностью 80% обнаружения эффекта, если он истинен (20% ошибки типа II) и вероятностью 5% обнаружения эффект, если такого эффекта нет (ошибка типа I).

    Мы можем решить эту проблему с помощью анализа мощности.

    Библиотека statsmodels предоставляет класс TTestIndPower для расчета анализа мощности для t-критерия Стьюдента с независимыми выборками. Следует отметить класс TTestPower, который может выполнять такой же анализ для парного критерия Стьюдента.

    Функцию resolve_power () можно использовать для вычисления одного из четырех параметров в анализе мощности. В нашем случае нас интересует расчет размера выборки. Мы можем использовать функцию, предоставив три части информации, которые мы знаем ( alpha , effect и power ) и установив размер аргумента, который мы хотим вычислить, ( nobs1 ) на « None». “.Это сообщает функции, что нужно вычислять.

    Примечание о размере выборки: функция имеет аргумент, называемый ratio, который представляет собой отношение количества выборок в одной выборке к другой. Если ожидается, что в обеих выборках будет одинаковое количество наблюдений, то соотношение будет 1,0. Если, например, ожидается, что во второй выборке будет вдвое меньше наблюдений, то соотношение будет 0,5.

    Необходимо создать экземпляр TTestIndPower, затем мы можем вызвать resolve_power () с нашими аргументами, чтобы оценить размер выборки для эксперимента.

    # выполнить анализ мощности анализ = TTestIndPower () result = analysis.solve_power (effect, power = power, nobs1 = None, ratio = 1.0, alpha = alpha)

    # выполнить анализ мощности

    analysis = TTestIndPower ()

    result = analysis.solve_power (effect, power = power, nobs1 = None, ratio = 1.0, alpha = alpha)

    Полный пример приведен ниже.

    # оценить размер выборки с помощью анализа мощности из statsmodels.stats.power импорт TTestIndPower # параметры для анализа мощности эффект = 0,8 альфа = 0,05 мощность = 0,8 # выполнить анализ мощности анализ = TTestIndPower () result = analysis.solve_power (эффект, мощность = мощность, nobs1 = нет, коэффициент = 1.0, альфа = альфа) print (‘Размер образца:% .3f’% результат)

    # оценить размер выборки с помощью анализа мощности

    из statsmodels.stats.power import TTestIndPower

    # параметры для анализа мощности

    эффект = 0,8

    альфа = 0,05

    мощность = 0,8

    # выполнить анализ мощности

    analysis = TTestIndPower ()

    result = analysis.solve_power (эффект, power = power, nobs1 = None, ratio = 1.0, alpha = alpha)

    print (‘Размер образца:% .3f’% результат)

    При выполнении примера вычисляется и печатается приблизительное количество образцов для эксперимента как 25.Это будет предлагаемое минимальное количество образцов, необходимое для того, чтобы увидеть эффект желаемого размера.

    Мы можем пойти еще дальше и рассчитать кривые мощности.

    Кривые мощности — это линейные графики, которые показывают, как изменение переменных, таких как размер эффекта и размер выборки, влияет на мощность статистического теста.

    Функцию plot_power () можно использовать для создания кривых мощности. Зависимая переменная (ось x) должна быть указана по имени в аргументе « dep_var ».Затем можно указать массивы значений для параметров размера выборки ( nobs ), размера эффекта ( effect_size ) и значимости ( alpha ). Затем будет построена одна или несколько кривых, показывающих влияние на статистическую мощность.

    Например, мы можем принять значение 0,05 (значение по умолчанию для функции) и изучить изменение размера выборки от 5 до 100 с низким, средним и высоким размером эффекта.

    # рассчитать кривые мощности на основе нескольких анализов мощности анализ = TTestIndPower () анализ.plot_power (dep_var = ‘nobs’, nobs = arange (5, 100), effect_size = array ([0.2, 0.5, 0.8]))

    # вычислить кривые мощности из нескольких анализов мощности

    analysis = TTestIndPower ()

    analysis.plot_power (dep_var = ‘nobs’, nobs = arange (5, 100), effect_size = array ([0.2, 0.5, 0.8]) )

    Полный пример приведен ниже.

    # рассчитать кривые мощности для различных выборок и размера эффекта из массива импорта numpy из matplotlib import pyplot из statsmodels.stats.power импорт TTestIndPower # параметры для анализа мощности effect_sizes = массив ([0,2, 0,5, 0,8]) sample_sizes = массив (диапазон (5, 100)) # рассчитать кривые мощности на основе нескольких анализов мощности анализ = TTestIndPower () analysis.plot_power (dep_var = ‘nobs’, nobs = sample_sizes, effect_size = effect_sizes) pyplot.show ()

    # вычислить кривые мощности для различных выборок и размера эффекта

    из массива импорта numpy

    из matplotlib import pyplot

    из statsmodels.stats.power import TTestIndPower

    # параметры для анализа мощности

    effect_sizes = array ([0.2, 0.5, 0.8])

    sample_sizes = array (range (5, 100))

    # рассчитать кривые мощности из нескольких анализов мощности

    analysis = TTestIndPower ()

    analysis.plot_power (dep_var = ‘nobs’, nobs = sample_sizes, effect_size = effect_sizes)

    pyplot.show ()

    При выполнении примера создается график, показывающий влияние на статистическую мощность (ось y) для трех различных размеров эффекта ( и ) при увеличении размера выборки (ось x).

    Мы можем видеть, что если мы заинтересованы в большом эффекте, то точка убывающей отдачи с точки зрения статистической мощности происходит примерно при 40-50 наблюдениях.

    Кривые мощности для t-теста студента

    Полезно, что в statsmodels есть классы для выполнения анализа мощности с другими статистическими тестами, такими как F-тест, Z-тест и критерий хи-квадрат.

    Расширения

    В этом разделе перечислены некоторые идеи по расширению учебника, которые вы, возможно, захотите изучить.

    • Постройте кривые мощности различных стандартных уровней значимости в зависимости от размера выборки.
    • Найдите пример исследования, в котором сообщается о статистической силе эксперимента.
    • Подготовьте примеры анализа производительности для других статистических тестов, предоставляемых statsmodels.

    Если вы изучите какое-либо из этих расширений, я хотел бы знать.

    Дополнительная литература

    В этом разделе представлены дополнительные ресурсы по теме, если вы хотите углубиться.

    Документы

    Книги

    API

    Статьи

    Резюме

    В этом руководстве вы узнали о статистической силе проверки гипотез и о том, как рассчитывать анализ мощности и кривые мощности в рамках экспериментального плана.

    В частности, вы выучили:

    • Статистическая мощность — это вероятность того, что проверка гипотезы обнаружит эффект, если эффект будет обнаружен.
    • Анализ мощности может использоваться для оценки минимального размера выборки, необходимого для эксперимента, с учетом желаемого уровня значимости, размера эффекта и статистической мощности.
    • Как рассчитать и построить график анализа мощности для t-критерия Стьюдента на Python, чтобы эффективно спланировать эксперимент.

    Есть вопросы?
    Задайте свои вопросы в комментариях ниже, и я постараюсь ответить.

    Получите доступ к статистике для машинного обучения!

    Развить рабочее понимание статистики

    … путем написания строк кода на Python

    Узнайте, как это сделать, в моей новой электронной книге:
    Статистические методы для машинного обучения

    Он предоставляет учебных пособий для самостоятельного изучения по таким темам, как:
    Проверка гипотез, корреляция, непараметрическая статистика, повторная выборка и многое другое…

    Узнайте, как преобразовать данные в знания

    Пропустить академики. Только результаты.

    Посмотрите, что внутри

    Статистическая мощность и ее значение

    Статистическая мощность или чувствительность — это вероятность того, что тест на значимость обнаружит эффект, когда он действительно есть.

    Истинный эффект — это реальное ненулевое отношение между переменными в генеральной совокупности. На эффект обычно указывает реальная разница между группами или корреляция между переменными.

    Высокая мощность исследования указывает на большую вероятность того, что тест обнаружит истинный эффект. Низкая мощность означает, что ваш тест имеет лишь небольшую вероятность обнаружения истинного эффекта или что результаты могут быть искажены случайной и систематической ошибкой.

    Мощность в основном зависит от размера выборки, размера эффекта и уровня значимости. Анализ мощности может использоваться для определения необходимого размера выборки для исследования.

    Почему мощность имеет значение в статистике?

    Необходима достаточная статистическая мощность, чтобы делать точные выводы о совокупности с использованием данных выборки.

    При проверке гипотез вы начинаете с нулевой гипотезы об отсутствии эффекта и альтернативной гипотезы об истинном эффекте (ваш фактический прогноз исследования).

    Цель состоит в том, чтобы собрать достаточно данных из выборки, чтобы статистически проверить, можете ли вы разумно отклонить нулевую гипотезу в пользу альтернативной гипотезы.

    Пример: нулевая и альтернативная гипотезы. Ваш исследовательский вопрос касается того, может ли времяпрепровождение на природе снизить уровень стресса у выпускников колледжей.Вы перефразируете это в нулевую и альтернативную гипотезу.
    • Нулевая гипотеза: Проведение 10 минут в день на открытом воздухе в естественной среде не влияет на стресс у недавних выпускников колледжей.
    • Альтернативная гипотеза: Проведение 10 минут в день на открытом воздухе в естественной среде уменьшит симптомы стресса у недавних выпускников колледжей.

    При интерпретации результатов исследования всегда существует риск сделать одну из двух ошибок решения:

    • Ошибка I типа : отклонение нулевой гипотезы об отсутствии эффекта, когда она действительно верна.
    • Ошибка типа II : не отвергать нулевую гипотезу об отсутствии эффекта, когда она фактически ложна.
    Пример: ошибки типа I и II
    • Ошибка типа I : вы пришли к выводу, что ежедневное пребывание на природе 10 минут снижает стресс, хотя на самом деле это не так.
    • Ошибка II типа : вы пришли к выводу, что ежедневные 10 минут на природе не влияют на стресс, хотя на самом деле это так.

    Мощность — это вероятность избежать ошибки типа II.Чем выше статистическая мощность теста, тем ниже риск ошибки типа II.

    Мощность обычно устанавливается на 80%. Это означает, что если есть истинные эффекты, которые можно обнаружить в 100 различных исследованиях с мощностью 80%, то только 80 из 100 статистических тестов действительно обнаружат их.

    Если вы не обеспечите достаточную мощность, ваше исследование может вообще не обнаружить истинный эффект. Это означает, что такие ресурсы, как время и деньги, тратятся впустую, и может быть даже неэтичным собирать данные от участников (особенно в клинических испытаниях).

    С другой стороны, слишком большая мощность означает, что ваши тесты очень чувствительны к истинным эффектам, в том числе очень маленьким. Это может привести к получению статистически значимых результатов с очень небольшой полезностью в реальном мире.

    Чтобы уравновесить эти плюсы и минусы низкой и высокой статистической мощности, вы должны использовать анализ мощности, чтобы установить соответствующий уровень.

    Что такое анализ мощности?

    Анализ мощности — это расчет, который помогает вам определить минимальный размер выборки для вашего исследования.

    Анализ мощности состоит из четырех основных компонентов. Если вы знаете или имеете оценки для любых трех из них, вы можете вычислить четвертый компонент.

    • Статистическая мощность: вероятность того, что тест обнаружит эффект определенного размера, если он есть, обычно устанавливается на уровне 80% или выше.
    • Размер выборки: минимальное количество наблюдений, необходимое для наблюдения эффекта определенного размера с заданным уровнем мощности.
    • Уровень значимости (альфа) : максимальный риск отклонения истинной нулевой гипотезы, которую вы готовы принять, обычно составляет 5%.
    • Ожидаемая величина эффекта: стандартизованный способ выражения величины ожидаемого результата вашего исследования, обычно основанный на аналогичных или пилотных исследованиях.

    Перед тем, как начать исследование, вы можете использовать анализ мощности, чтобы вычислить минимальный размер выборки для желаемого уровня мощности и уровня значимости, а также ожидаемого размера эффекта.

    Обычно уровень значимости устанавливается на 5%, а желаемый уровень мощности — на 80%. Это означает, что вам нужно только вычислить ожидаемую величину эффекта, чтобы рассчитать размер выборки на основе анализа мощности.

    Чтобы рассчитать размер выборки или выполнить анализ мощности, используйте онлайн-инструменты или статистическое программное обеспечение, такое как G * Power.

    Размер выборки

    Размер выборки положительно зависит от мощности. Маленькая выборка (менее 30 единиц) может иметь только низкую мощность, в то время как большая выборка имеет высокую мощность.

    Увеличение размера выборки увеличивает мощность, но только до определенного предела. Когда у вас достаточно большая выборка, каждое наблюдение, добавляемое к выборке, лишь незначительно увеличивает мощность. Это означает, что сбор большего количества данных увеличит время, затраты и усилия на ваше исследование, но не принесет гораздо большей пользы.

    План вашего исследования также связан с мощностью и размером выборки:

    • В дизайне внутри субъектов каждый участник тестируется во всех вариантах лечения в исследовании, поэтому индивидуальные различия не будут неравномерно влиять на результаты разных курсов лечения.
    • В межпредметном дизайне каждый участник принимает участие только в одном сеансе лечения, поэтому с разными участниками в каждом сеансе лечения есть шанс, что индивидуальные различия могут повлиять на результаты.

    Внутрипредметный дизайн более эффективен, поэтому требуется меньше участников. Чтобы установить взаимосвязь между переменными, требуется больше участников.

    Уровень значимости

    Уровень значимости исследования — это вероятность ошибки типа I, обычно он составляет 5%. Это означает, что ваши результаты должны иметь вероятность менее 5% при нулевой гипотезе, чтобы считаться статистически значимыми.

    Уровень значимости коррелирует с мощностью: повышение уровня значимости (например,г., от 5% до 10%) увеличивает мощность. Когда вы уменьшаете уровень значимости, ваш тест на значимость становится более консервативным и менее чувствительным к обнаружению истинных эффектов.

    Исследователи должны уравновесить риски совершения ошибок типа I и II, рассматривая степень риска, на который они готовы пойти, сделав ложноположительный или ложноотрицательный вывод.

    Размер эффекта

    Размер эффекта — это величина различия между группами или взаимосвязи между переменными.Это указывает на практическое значение открытия.

    В то время как исследования с большой мощностью могут помочь вам обнаружить средние и большие эффекты в исследованиях, исследования с малой мощностью могут выявить только большие.

    Пример: Оценка ожидаемой величины эффекта В вашем исследовании основным эффектом является разница в исходном и последующем уровнях стресса в результате ежедневного пребывания на природе.

    Чтобы определить ожидаемую величину эффекта, вы выполняете систематический обзор литературы, чтобы найти похожие исследования. Вы сужаете список релевантных исследований до тех, которые манипулируют временем, проведенным на природе, и используют стресс в качестве основной меры.

    Для пяти исследований, отвечающих этим критериям, вы берете каждую из заявленных величин эффекта и вычисляете средний размер эффекта. Вы принимаете это среднее значение как ожидаемый размер эффекта.

    Всегда есть некоторая ошибка выборки при использовании данных из выборок, чтобы сделать выводы о популяциях. Это означает, что всегда существует несоответствие между наблюдаемой величиной эффекта и истинной величиной эффекта. Величина эффекта в исследовании может варьироваться из-за случайных факторов, ошибки измерения или естественных вариаций в выборке.

    Исследования с малой мощностью обычно обнаруживают истинные эффекты только тогда, когда они являются значительными в исследовании. Это означает, что в маломощном исследовании любой наблюдаемый эффект с большей вероятностью будет усилен несвязанными факторами.

    Если маломощные исследования являются нормой в определенной области, такой как нейробиология, наблюдаемые размеры эффекта будут постоянно преувеличивать или переоценивать истинные эффекты.

    Какая у вас оценка за плагиат?

    Сравните свою статью с более чем 60 миллиардами веб-страниц и 30 миллионами публикаций.

    • Лучшая программа проверки плагиата 2020 года
    • Отчет о плагиате и процентное содержание
    • Самая большая база данных о плагиате

    Scribbr Проверка на плагиат

    Прочие факторы, влияющие на мощность

    Помимо четырех основных компонентов, при определении мощности необходимо учитывать и другие факторы.

    Изменчивость

    Изменчивость характеристик популяции влияет на мощность вашего теста.Высокая дисперсия населения снижает мощность.

    Другими словами, использование генеральной совокупности, которая принимает большой диапазон значений переменной, снизит чувствительность вашего теста, в то время как использование генеральной совокупности, в которой переменная относительно узко распределена, повысит чувствительность теста.

    Использование довольно конкретной группы населения с определенными демографическими характеристиками может снизить разброс интересующей переменной и повысить мощность.

    Пример: минимизация изменчивости Стресс — это переменная, которая широко варьируется среди всего населения США.Но та же самая переменная может иметь более узкое распределение (принимать меньший диапазон значений) в конкретной и четко определенной группе населения, например, среди выпускниц колледжей в возрасте до 25 лет. Низкая вариабельность уровней стресса повысит эффективность теста в вашем исследовании стресса.

    Ошибка измерения

    Ошибка измерения — это разница между истинным значением и наблюдаемым или зарегистрированным значением чего-либо. Измерения могут быть настолько точными, насколько точны инструменты и исследователи, которые их измеряют, поэтому некоторые ошибки почти всегда присутствуют.

    Чем выше ошибка измерения в исследовании, тем ниже статистическая мощность теста. Ошибка измерения может быть случайной или систематической:

    • Случайные ошибки непредсказуемы и неравномерно изменяют измерения из-за случайных факторов (например, изменение настроения может повлиять на ответы на опрос, или плохой день может привести к тому, что исследователи неверно зафиксируют наблюдения).
    • Систематические ошибки предсказуемо влияют на данные от одного измерения к другому (например,g. неправильно откалиброванное устройство будет постоянно записывать неточные данные, или проблемные вопросы опроса могут привести к предвзятым ответам).

    Как увеличить мощность?

    Поскольку многие аспекты исследования прямо или косвенно влияют на мощность, существуют различные способы ее улучшения. Хотя некоторые из них обычно можно реализовать, другие дороги или требуют компромисса с другими важными соображениями.

    Увеличить размер эффекта. Чтобы увеличить ожидаемый эффект в эксперименте, вы можете более широко манипулировать своей независимой переменной (например,g., проводя на природе 1 час вместо 10 минут), чтобы усилить влияние на зависимую переменную (уровень стресса). Это не всегда возможно, потому что существуют пределы того, насколько могут отличаться результаты эксперимента.

    Увеличить размер выборки. Основываясь на расчетах размера выборки, у вас может быть возможность увеличить размер выборки, при этом значительно улучшив мощность. Но есть момент, когда увеличение размера выборки может не принести достаточно высоких результатов.

    Увеличить уровень значимости. Хотя это делает тест более чувствительным к обнаружению истинных эффектов, это также увеличивает риск ошибки типа I.

    Уменьшить погрешность измерения. Повышение точности и точности ваших измерительных устройств и процедур снижает изменчивость, повышая надежность и мощность. Использование нескольких показателей или методов, известных как триангуляция, также может помочь уменьшить систематическую погрешность.

    Используйте односторонний тест вместо двустороннего. При использовании теста t или z односторонний тест имеет более высокую мощность.Однако односторонний тест следует использовать только тогда, когда есть веские основания ожидать эффекта в определенном направлении (например, один средний балл будет выше другого), потому что он не сможет обнаружить эффект в другое направление. Напротив, двусторонний тест может обнаружить эффект в любом направлении.

    Часто задаваемые вопросы о статистической мощности

    Что такое статистическая мощность?

    В статистике мощность относится к вероятности проверки гипотезы, обнаруживающей истинный эффект, если он есть.Статистически мощный тест с большей вероятностью отклонит ложноотрицательный результат (ошибка типа II).

    Если вы не обеспечите достаточную мощность в своем исследовании, вы не сможете обнаружить статистически значимый результат, даже если он имеет практическое значение. Ваше исследование может не дать ответа на ваш исследовательский вопрос.

    Что такое статистическая значимость?

    Статистическая значимость — это термин, используемый исследователями, чтобы заявить, что маловероятно, что их наблюдения могли иметь место при нулевой гипотезе статистического теста.Значимость обычно обозначается значением p или значением вероятности.

    Статистическая значимость произвольна — она ​​зависит от порога или значения альфа, выбранного исследователем. Наиболее распространенный порог — p <0,05, что означает, что данные, вероятно, будут появляться менее чем в 5% случаев при нулевой гипотезе.

    Когда значение p падает ниже выбранного альфа-значения, мы говорим, что результат теста статистически значим.

    Что такое анализ мощности?

    Анализ мощности — это расчет, который помогает вам определить минимальный размер выборки для вашего исследования. Он состоит из четырех основных компонентов. Если вы знаете или имеете оценки для любых трех из них, вы можете вычислить четвертый компонент.

    • Статистическая мощность : вероятность того, что тест обнаружит эффект определенного размера, если он есть, обычно устанавливается на уровне 80% или выше.
    • Размер выборки : минимальное количество наблюдений, необходимое для наблюдения эффекта определенного размера с заданным уровнем мощности.
    • Уровень значимости (альфа) : максимальный риск отклонения истинной нулевой гипотезы, которую вы готовы принять, обычно составляет 5%.
    • Размер ожидаемого эффекта : стандартизованный способ выражения величины ожидаемого результата вашего исследования, обычно основанный на аналогичных или пилотных исследованиях.
    Как увеличить статистическую мощность?

    Есть разные способы улучшить мощность:

    • Увеличьте размер потенциального эффекта, более сильно манипулируя вашей независимой переменной,
    • Увеличить размер выборки,
    • Повышение уровня значимости (альфа),
    • Уменьшите погрешность измерения за счет повышения точности и точности ваших измерительных устройств и процедур,
    • Используйте односторонний тест вместо двустороннего для тестов t и z .

    Объяснение электроэнергии — данные и статистика

    Данные по США за 2019 год (за исключением случаев, когда это указано).

    Примечание: MW = мегаватты, MWh = мегаватт-часы, KW = киловатты, и kWh = киловатт-часы

    Мощность генераторов коммунальных предприятий по выработке электроэнергии (чистая летняя мощность)
    Общая полезная мощность
    1 099 109 МВт или около 1.1 миллиард кВт
    Доля мощности по источникам энергии
    Природный газ 43,4%
    Уголь 20,8%
    Негидроэлектрические возобновляемые источники энергии 14,3%
    Гидроэлектростанции (всего) 9,3%
    Обычная гидросистема 7.3%
    ГАЗ 2,1%
    Ядерная 8,9%
    Нефть 2,9%
    Другое 0,2%
    Итого не может равняться 100% из-за независимого округления.
    Крупнейшая по мощности электростанция Плотина Гранд-Кули (гидроэлектростанция) —7 079 МВт
    Выбросы
    Выбросы электростанций
    Двуокись углерода (CO2) 1,724,396 тыс. Метрических тонн (около 1.72 миллиарда метрических тонн или около 1,90 миллиарда коротких тонн)
    Диоксид серы (SO2) 1267 тысяч метрических тонн (около 1,27 миллиона метрических тонн или около 1,4 миллиона коротких тонн)
    Оксиды азота (NOx) 1342 тысячи метрических тонн (около 1,34 миллиона метрических тонн или около 1,48 миллиона коротких тонн

    Последнее обновление: 3 ноября 2020 г.

    Что это такое и когда следует использовать?

    Clin Orthop Relat Res.2011 фев; 469 (2): 619–620.

    , PhD

    Frederick J. Dorey

    Департамент педиатрии детской больницы Лос-Анджелеса, 4650 Sunset Blvd, Mailstop 54, Los Angeles, CA

    USA

    Департамент педиатрии детской больницы Лос-Анджелеса, 4650 Sunset Blvd , Mailstop 54, Los Angeles, CA

    USA

    Автор, отвечающий за переписку. Авторские права © Ассоциация костных и суставных хирургов® 2010 Эта статья цитируется в других статьях в PMC.

    Предпосылки

    Хотя любой отчет, формально проверяющий гипотезу, должен включать соответствующее значение p и доверительный интервал, другой статистической концепцией, которая в некотором смысле более важна, является мощность исследования. В отличие от значения p и доверительного интервала, вопрос мощности следует рассмотреть даже до того, как приступить к клиническому исследованию.

    Вопрос

    Что такое статистическая мощность, когда ее следует использовать и какая информация необходима для расчета мощности?

    Обсуждение

    Как и значение p, степень является условной вероятностью.При проверке гипотез альтернативной гипотезой является утверждение, что нулевая гипотеза ложна. Если альтернативная гипотеза действительно верна, сила — это вероятность того, что кто-то правильно отвергнет нулевую гипотезу. Наиболее значимое применение статистической мощности — это решить до начала клинического исследования, стоит ли его проводить с учетом необходимых усилий, затрат и, в случае клинических экспериментов, участия пациента. Проверка гипотез с небольшой мощностью, вероятно, даст большие значения p и большие доверительные интервалы.Таким образом, когда мощность предлагаемого исследования невысока, даже при наличии реальных различий между исследуемыми видами лечения, наиболее вероятным результатом исследования будет отсутствие достаточных доказательств для отклонения H 0 , и значимые клинические различия останутся. обсуждаемый. В этой ситуации уместно задать вопрос: стоит ли исследование затраченного времени и усилий на получение так мало дополнительной информации.

    Обычный вопрос, связанный со статистической мощностью: какой размер выборки даст разумную мощность (как бы она ни была определена) для исследуемой первичной гипотезы.Однако во многих случаях более реалистичным будет вопрос: какова будет статистическая мощность важных проверок гипотез, учитывая наиболее вероятный размер выборки, который может быть получен в ходе предлагаемого исследования?

    Для любой данной статистической процедуры и уровня значимости существуют три статистических концепции, тесно связанных друг с другом. Это размер выборки, размер эффекта и мощность. Если вы знаете любые два из них, третий можно определить. Чтобы определить размер эффекта, исследователь сначала должен оценить величину минимальной клинически важной разницы (MCID), которую эксперимент призван обнаружить.Затем это значение делится на оценку изменчивости данных, поскольку интерпретация чисел имеет смысл только в отношении изменчивости оцененных параметров. Хотя исследователи обычно могут дать разумную оценку MCID для исследования, они часто мало знают о вариабельности своих данных. Во многих случаях стандартное отклонение контрольной группы дает хорошую оценку этой изменчивости. Поскольку интуитивно должно быть легче определить, отличаются ли две группы большим, а не небольшим клинически значимым различием, из этого следует, что больший размер эффекта обычно приводит к большей мощности.Кроме того, больший размер выборки приводит к большей точности оцениваемых параметров, что приводит к большей мощности, поскольку оценки с большей вероятностью будут ближе к истинным значениям в целевой совокупности. (Более подробная статья Биау и др. [1] обсуждает взаимосвязь между мощностью и размером выборки вместе с примерами.)

    Для того, чтобы расчеты мощности были значимыми, сначала необходимо решить, какой размер эффекта нужен. Размер эффекта должен быть определен в первую очередь, потому что для любого предлагаемого размера выборки всегда можно выбрать размер эффекта, который приведет к любой желаемой мощности.Короче говоря, только цели эксперимента должны определять размер эффекта. После того, как исследование было завершено и проанализировано, доверительный интервал показывает, сколько или мало было изучено, и мощность не внесет какой-либо значимой дополнительной информации. При подробном обсуждении апостериорных вычислений мощности в целом Хёниг и Хейси [2] показали, что если проверка гипотезы была выполнена с результирующим значением p, превышающим 5% уровень значимости, то мощность для обнаружения наблюдаемой разницы будет только быть примерно 50% или меньше.Однако можно легко проверить на примерах, что тесты гипотез, приводящие к очень малым значениям p (например, 0,015), могут иметь апостериорную мощность даже менее 70%; в таком случае трудно увидеть, как вычисление мощности post hoc внесет больше информации, чем то, что уже известно.

    Между концепциями проверки гипотез и диагностической проверки существует очень хорошая взаимосвязь. Пусть нулевая гипотеза представляет отсутствие данного заболевания, альтернативная гипотеза представляет наличие болезни, а отклонение нулевой гипотезы представляет наличие положительного диагностического теста.С этими предположениями мощность просто эквивалентна чувствительности теста (вероятность того, что тест окажется положительным, когда присутствует заболевание). Кроме того, уровень значимости эквивалентен единице за вычетом специфичности теста, или, другими словами, ошибка, на которую вы готовы рискнуть, ложно отвергнув нулевую гипотезу, просто соответствует вероятности получения положительного теста среди пациентов без заболевания. .

    Мифы и заблуждения

    Как обсуждалось выше, понятие мощности после сбора данных не дает очень много дополнительной информации о результатах проверки гипотез.Это проиллюстрировано рассмотрением эксперимента по подбрасыванию монеты 10 раз, чтобы убедиться, что монета справедливая, то есть вероятность выпадения орла равна 0,5. Предположим, вы подбрасываете монету 10 раз и получаете 10 орлов. Этот эксперимент всего с 10 подбрасываниями имеет очень мало возможностей для проверки честности монеты. Однако значение p для получения 10 орлов за 10 бросков с честной монетой (нулевая гипотеза) очень мало, поэтому нулевая гипотеза, безусловно, будет отклонена. Таким образом, даже несмотря на то, что эксперимент имеет небольшую мощность, он не меняет того факта, что эксперимент был проведен и предоставил убедительные доказательства того, что монета смещена в пользу орлов.Не рекомендую делать ставку на решку.

    Другой миф состоит в том, что мощность всегда должна быть не менее 80% или больше. Это может быть разумным ожиданием для клинического исследования, которое потенциально может вызвать большие неудобства или риски для пациентов. Однако в лабораторных исследованиях или ретроспективных корреляционных исследованиях обычно нет необходимости в такой высокой мощности.

    Выводы

    Концепция статистической мощности должна использоваться до начала исследования, чтобы помочь определить, разумно и этично продолжать исследование.Расчет статистической мощности также иногда бывает полезен постфактум, когда отмечаются статистически незначимые, но потенциально клинически важные тенденции, например, при исследовании двух методов лечения рака. Такие апостериорные тесты могут проинформировать читателя или будущих исследователей, сколько пациентов может потребоваться, чтобы показать статистические различия. Мощность и размер эффекта, необходимые для того, чтобы исследование было разумным, также будут зависеть от задаваемого медицинского вопроса и информации, уже доступной в литературе.

    Сноски

    Каждый автор удостоверяет, что он или она не имеет коммерческих ассоциаций (например, консалтинговых компаний, владения акциями, долей участия, патентных / лицензионных соглашений и т. Д.), Которые могли бы вызвать конфликт интересов в связи с представленной статьей.

    Список литературы

    1. Био Д. Д., Кернейс С., Порчер Р. Краткая статистика: важность размера выборки при планировании и интерпретации медицинских исследований. Clin Orthop Relat Res. 2008; 466: 2282–2288. DOI: 10.1007 / s11999-008-0346-9.[Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar] 2. Hoenig JM, Heisey DM. Злоупотребление властью: распространенная ошибка вычислений мощности для анализа данных. Am Stat. 2001; 55: 19–24. DOI: 10.1198 / 000313001300339897. [CrossRef] [Google Scholar]

    статистических данных | Безграничная статистика

    Статистическая мощность

    Статистическая мощность помогает нам ответить на вопрос, сколько данных нужно собрать, чтобы получить надежные результаты.

    Цели обучения

    Обсудите статистическую мощность, связанную с проверкой значимости, и разбейте факторы, которые на нее влияют.

    Основные выводы

    Ключевые моменты
    • Статистическая мощность — это вероятность того, что тест обнаружит статистически значимую разницу между двумя выборками, как функцию размера истинной разницы между двумя популяциями.
    • Статистическая мощность — это вероятность обнаружения разницы, которая действительно существует, в отличие от вероятности объявления несуществующей разницы.
    • Статистическая мощность зависит от критерия значимости, используемого в тесте, величины интересующего эффекта в совокупности и размера выборки, используемой для обнаружения эффекта.
    Ключевые термины
    • нулевая гипотеза : гипотеза, которую нужно опровергнуть, чтобы поддержать альтернативную гипотезу; считается истинным до тех пор, пока статистические данные в виде проверки гипотезы не укажут иное.
    • критерий значимости : утверждение о том, насколько маловероятным должен быть положительный результат, если нулевая гипотеза об отсутствии эффекта верна, для отклонения нулевой гипотезы
    • Ошибка типа I : ошибка возникает, когда нулевая гипотеза (H0) верна, но отклоняется.

    В статистической практике можно упустить реальный эффект, просто не взяв достаточно данных. В большинстве случаев это проблема. Например, мы можем пропустить жизнеспособное лекарство или не заметить важный побочный эффект. Как мы узнаем, сколько данных нужно собрать? Статистики дают ответ в виде статистической мощности.

    Фон

    Статистические тесты используют данные из выборок для оценки или заключения о статистической совокупности. В конкретных условиях сравнения двух выборок цель состоит в том, чтобы оценить, различаются ли средние значения какого-либо атрибута, полученные для лиц в двух подгруппах.Например, для проверки нулевой гипотезы о том, что средние баллы мужчин и женщин на тесте не различаются, составляются выборки мужчин и женщин. Им проводится тест, и средний балл одной группы сравнивается со средним баллом другой группы с использованием статистического теста, такого как двухвыборочный z-тест . Мощность теста — это вероятность того, что тест обнаружит статистически значимую разницу между мужчинами и женщинами, как функцию размера истинной разницы между этими двумя популяциями.Обратите внимание, что мощность — это вероятность обнаружения разницы, которая действительно существует, в отличие от вероятности объявления несуществующей разницы (которая известна как ошибка типа I или «ложное срабатывание»).

    Факторы, влияющие на власть

    Статистическая мощность может зависеть от ряда факторов. Некоторые из этих факторов могут быть специфическими для конкретной ситуации тестирования, но, как минимум, мощность почти всегда зависит от следующих трех факторов:

    1. Критерий статистической значимости, используемый в тесте: Критерий значимости — это утверждение о том, насколько маловероятным должен быть положительный результат, если нулевая гипотеза об отсутствии эффекта верна, для отклонения нулевой гипотезы.Наиболее часто используемые критерии — это вероятности 0,05 (5%, 1 из 20), 0,01 (1%, 1 из 100) и 0,001 (0,1%, 1 из 1000). Один из простых способов повысить эффективность теста — провести менее консервативный тест, используя более высокий критерий значимости, например 0,10 вместо 0,05. Это увеличивает вероятность отклонения нулевой гипотезы, когда нулевая гипотеза ложна, но также увеличивает риск получения статистически значимого результата (т. Е. Отклонения нулевой гипотезы), когда нулевая гипотеза не ложна.
    2. Величина эффекта, представляющего интерес для населения: Величину эффекта, представляющего интерес для населения, можно количественно выразить в терминах размера эффекта, где больше возможностей для обнаружения более значительных эффектов. Размер эффекта может быть прямой оценкой интересующего количества или стандартизированным показателем, который также учитывает изменчивость в популяции. При правильном построении стандартизованный размер эффекта вместе с размером выборки полностью определяет мощность.Нестандартизованная (прямая) величина эффекта редко бывает достаточной для определения мощности, поскольку она не содержит информации о вариабельности измерений.
    3. Размер выборки, используемый для обнаружения эффекта: Размер выборки определяет величину ошибки выборки, присущей результату теста. При прочих равных, эффекты труднее обнаружить в меньших выборках. Увеличение размера выборки часто является самым простым способом повысить статистическую мощность теста.

    Простой пример

    Предположим, игрок убежден, что у оппонента несправедливая монета.Вместо того, чтобы получать орел в половине случаев и решку в половине случаев, пропорция другая, и противник использует это, чтобы обмануть в невероятно скучных играх с подбрасыванием монеты. Как мы это докажем?

    Допустим, мы ищем критерий значимости 0,05. То есть, если мы посчитаем количество орлов после 10 или 100 попыток и найдем отклонение от ожидаемого — половина решки, половина решки — монета будет несправедливой, если есть только 5% -ный шанс получить отклонение, которое размер или больше с честной монетой.Что произойдет, если мы подбросим монетку 10 раз и применим эти критерии?

    Кривая мощности 1 : Этот график показывает истинную вероятность выпадения орла при подбрасывании монеты 10 раз.

    Это называется кривой мощности. По горизонтальной оси представлены различные возможности истинной вероятности выпадения орла для монеты, соответствующие разным уровням несправедливости. По вертикальной оси отложена вероятность того, что я сделаю вывод, что монета сфальсифицирована после 10 бросков, на основе вероятности результата.

    Этот график показывает, что монета настроена так, чтобы выпадать орел в 60% случаев. Однако, если мы подбросим монету только 10 раз, у нас будет только 20% шанс сделать вывод, что она сфальсифицирована. Слишком мало данных, чтобы отделить такелаж от случайной вариации. Однако что, если мы подбросим монету 100 раз?

    Кривая мощности 2 : Этот график показывает истинную вероятность выпадения орла при подбрасывании монеты 100 раз.

    Или 1000 раз?

    Кривая мощности 3 : Этот график показывает истинную вероятность выпадения орла при подбрасывании монеты 1000 раз.

    Имея 1000 подбрасываний, мы можем легко определить, сфальсифицирована ли монета так, чтобы выпадать орел в 60% случаев. Крайне маловероятно, что мы могли бы подбросить справедливую монету 1000 раз и получить более 600 орлов.

    Статистическая мощность

    : что нужно знать для A / B-тестирования

    Несколько лет назад, когда я впервые начал проводить сплит-тестирование, я думал, что каждое испытание стоит проводить. Не имело значения, менял ли он цвет кнопки или заголовок — я хотел провести этот тест.

    Мое восторженное, но ошибочное мнение заключалось в том, что мне просто нужно было найти аспекты для оптимизации, настроить инструмент и начать тестирование.После этого, подумал я, нужно было просто дождаться печально известной статистической значимости в 95%.

    Я ошибался.

    После внедрения «статистически значимых» вариантов я не испытал роста продаж, потому что не было истинного роста — «он был воображаемым». Многие из этих тестов с самого начала были обречены. Я совершал типичные статистические ошибки, например, не тестировал полный бизнес-цикл или не принимал во внимание размер эффекта.

    Я также не учел и другую возможность: что тест «с недостаточной мощностью» может привести к тому, что я пропущу изменения, что вызовет «истинный подъем».”

    Понимание статистической мощности или «чувствительности» теста является важной частью предварительного планирования и поможет вам внести больше прибыльных изменений на ваш сайт.

    Что такое статистическая мощность?

    Статистическая мощность — это вероятность наблюдения статистически значимого результата на уровне альфа (α), если присутствует истинный эффект определенной величины. Это ваша способность обнаруживать разницу между вариантами теста , когда разница действительно существует .

    Статистическая мощность — это венец усердной работы, которую вы вложили в исследование конверсии и правильно расставленные приоритеты лечения по сравнению с контролем. Вот почему сила так важна — она ​​увеличивает вашу способность находить и измерять различия, когда они действительно есть.

    Статистическая мощность (1 — β) имеет обратную связь с ошибками типа II (β). Это также то, как контролировать возможность ложноотрицательных результатов. Мы хотим снизить риск ошибок типа I до приемлемого уровня, сохранив при этом достаточную мощность для обнаружения улучшений, если тестовые процедуры действительно лучше.

    Как будет сказано ниже, поиск правильного баланса — это одновременно искусство и наука. Если один из ваших вариантов лучше, правильно проведенный тест делает вероятным обнаружение улучшения. Если ваш тест недостаточно мощный, у вас неприемлемо высокий риск не отклонить ложное значение NULL.

    Прежде чем перейти к компонентам статистической мощности, давайте рассмотрим ошибки, которые мы пытаемся учесть.

    Ошибки типа I и типа II

    Ошибки типа I

    Ошибка типа I или ложное срабатывание отклоняет нулевую гипотезу, которая на самом деле верна. Ваш тест измеряет разницу между вариантами, которой в действительности не существует. Наблюдаемое различие — то, что тестируемое лечение превзошло контроль — является иллюзорным и вызвано случайностью или ошибкой.

    Вероятность ошибки типа I, обозначаемая греческой буквой альфа (α), является уровнем значимости для вашего A / B-теста. Если вы проводите тестирование с уровнем достоверности 95%, это означает, что вероятность ошибки типа I составляет 5% (1,0–0,95 = 0,05).

    Если 5% слишком велико, вы можете снизить вероятность ложного срабатывания, увеличив уровень достоверности с 95% до 99% или даже выше.Это, в свою очередь, снизит вашу альфу с 5% до 1%. Но такое снижение вероятности ложного срабатывания обходится дорого.

    При повышении уровня уверенности увеличивается риск ложноотрицательного результата (ошибка типа II). Это происходит из-за обратной зависимости между альфа и бета — уменьшение одного увеличивает другое.

    Понижение альфа (например, с 5% до 1%) снижает статистическую мощность вашего теста. По мере того, как вы понижаете альфа, критическая область становится меньше, а меньшая критическая область означает меньшую вероятность отклонения нуля — следовательно, более низкий уровень мощности. И наоборот, , если вам нужно больше мощности, один из вариантов — увеличить альфа (например, с 5% до 10%).

    Ошибки типа II

    Ошибка типа II или ложноотрицательный — это неспособность отклонить нулевую гипотезу, которая на самом деле ложна. Ошибка типа II возникает, когда ваш тест не обнаруживает существенного улучшения вашего варианта, который действительно существует.

    Бета (β) — это вероятность ошибки типа II, имеющая обратную зависимость от статистической мощности (1 — β).Если 20% — это риск совершения ошибки типа II (β), то ваш уровень мощности составляет 80% (1,0 — 0,2 = 0,8). Вы можете снизить риск ложноотрицательного результата до 10% или 5% — для уровней мощности 90% или 95% соответственно.

    Ошибки типа II контролируются выбранным вами уровнем мощности: чем выше уровень мощности, тем ниже вероятность ошибки типа II. Поскольку альфа и бета имеют обратную связь, использование чрезвычайно низких значений альфа (например, 0,001%) при прочих равных значительно увеличит риск ошибки типа II.

    Статистическая мощность — это баланс с компромиссами для каждого теста. Как говорит Пол Д. Эллис: «Хорошо продуманный план исследования — это такой план, который оценивает относительный риск совершения каждого типа ошибок, а затем устанавливает соответствующий баланс между ними».

    Что касается статистической мощности, какие переменные влияют на этот баланс? Давайте взглянем.

    Переменные, влияющие на статистическую мощность

    При рассмотрении каждой переменной, влияющей на статистическую мощность, помните: основная цель — контролировать уровень ошибок.Вы можете тянуть четыре рычага:

    1. Размер выборки
    2. Минимальный интересующий эффект (MEI, или минимальный обнаруживаемый эффект)
    3. Уровень значимости (α)
    4. Желаемый уровень мощности (предполагаемая частота ошибок типа II)

    1. Размер выборки

    800-фунтовая горилла статистической мощи — это размер выборки. Вы можете многое понять, имея достаточно большой размер выборки. Хитрость заключается в том, чтобы рассчитать размер выборки, который может обеспечить достаточную мощность вашего теста, но не настолько большой, чтобы продлить его выполнение, чем необходимо.(Более длительный тест стоит дороже и снижает скорость тестирования.)

    Вам необходимо достаточное количество посетителей для каждого варианта , а также для каждого сегмента , который вы хотите проанализировать. Предварительное планирование размера выборки помогает избежать тестов с недостаточной мощностью; в противном случае вы можете не осознавать, что запускаете слишком много вариантов или сегментов, пока не станет слишком поздно, в результате чего у вас останутся группы после тестирования с низким количеством посетителей.

    Ожидайте статистически значимого результата в разумные сроки — обычно не менее одной полной недели или рабочего цикла.Общее правило — запускать тесты в течение как минимум двух недель, но не более четырех, чтобы избежать проблем, связанных с загрязнением образцов и удалением файлов cookie.

    Установление минимального размера выборки и заранее установленного временного горизонта позволяет избежать распространенной ошибки, связанной с простым запуском теста до тех пор, пока он не сгенерирует статистически значимую разницу, а затем его остановкой (просмотром).

    2. Минимальный эффект интереса (MEI)

    Минимальный интересующий эффект (MEI) — это величина (или размер) различий в результатах, которые вы хотите обнаружить.

    Более мелкие различия труднее обнаружить и требуют большего размера выборки для сохранения той же мощности; эффекты большей величины могут быть надежно обнаружены при меньшем размере выборки. Тем не менее, как отмечает Георгий Георгиев, эти большие «улучшения» по сравнению с небольшими размерами выборки могут быть ненадежными:

    Проблема в том, что обычно не существовало ни надлежащего правила остановки, ни фиксированного размера выборки, поэтому указанные номинальные значения p и доверительный интервал (ДИ) не имеют смысла.Можно сказать, что результаты были в каком-то смысле «вишневыми».

    Если было правильное правило остановки или фиксированный размер выборки, то наблюдаемое улучшение на 500% по сравнению с очень маленьким размером выборки, вероятно, будет сопровождаться 95% доверительным интервалом, скажем, от + 5% до + 995%: не очень информативно.

    Прекрасный способ визуализировать взаимосвязь между мощностью и величиной эффекта — это иллюстрация Георгиева, где он сравнивает мощность с рыболовной сетью:

    3. Статистическая значимость

    Как объяснил Георгиев:

    Наблюдаемый результат теста считается статистически значимым, если очень маловероятно, что мы наблюдаем такой результат, предполагая, что нулевая гипотеза верна.

    Это затем позволяет нам рассуждать иначе и сказать, что у нас есть доказательства против нулевой гипотезы в той степени, в которой такой экстремальный результат или более экстремальный результат не наблюдался бы, если бы нулевое значение было истинным (p-значение) .

    Это определение часто сводится к более простой интерпретации: если ваш сплит-тест для двух целевых страниц дает 95% -ную уверенность в пользу варианта, существует только 5% -ная вероятность того, что наблюдаемое улучшение произошло случайно, или 95% -ная вероятность что разница составляет , а не из-за случайного совпадения.

    «Многие, понимая строгое значение« наблюдаемого улучшения, возникшего в результате случайной случайности », отвергли бы такое заявление», — утверждал Георгиев. «Нам нужно помнить, что то, что позволяет нам оценить эти вероятности, — это предположение, что нуль истинен».

    Пять процентов — это общий начальный уровень значимости при онлайн-тестировании и, как упоминалось ранее, это вероятность совершения ошибки типа I. Использование 5% альфа для вашего теста означает, что вы готовы принять 5% вероятность того, что вы неправильно отвергли нулевую гипотезу.

    Если вы понижаете альфа с 5% до 1%, вы одновременно увеличиваете вероятность совершения ошибки типа II, при условии, что все остальное равно. Увеличение вероятности ошибки типа II снижает мощность вашего теста.

    4. Желаемый уровень мощности

    При мощности 80% у вас есть 20% вероятность того, что не сможет обнаружить фактическую разницу для данной интересующей величины. Если 20% слишком рискованно, вы можете снизить эту вероятность до 10%, 5% или даже 1%, что повысит вашу статистическую мощность до 90%, 95% или 99% соответственно.

    Прежде чем думать, что вы решите все свои проблемы, запустив тесты на 95% или 99% мощности, поймите, что каждое увеличение мощности требует соответствующего увеличения размера выборки и количества времени, необходимого для выполнения теста ( время, которое вы могли бы потратить на проведение проигрышного теста — и потерю продаж — только ради дополнительных процентных пунктов статистической вероятности).

    Итак, сколько мощности вам действительно нужно ? Обычная отправная точка для приемлемого риска ложных отрицательных результатов при оптимизации конверсии — 20%, что возвращает уровень мощности 80%.

    Нет ничего определенного в отношении уровня мощности 80%, но статистик Джейкоб Коэн предполагает, что 80% представляет собой разумный баланс между альфа- и бета-риском. Другими словами, по словам Эллиса, «исследования не должны иметь более 20% вероятности сделать ошибку типа II».

    В конечном итоге это вопрос:

    • Насколько вы готовы пойти на риск, если упустит реального улучшения;
    • Минимальный размер выборки, необходимый для каждого варианта для достижения желаемой мощности.

    Как рассчитать статистическую мощность для вашего теста

    Используя калькулятор размера выборки или G * power, вы можете ввести свои значения, чтобы узнать, что требуется для выполнения теста с достаточной мощностью. Если вы знаете три входных параметра, вы можете вычислить четвертый.

    В этом случае, используя G * Power, мы пришли к выводу, что нам нужна выборка из 681 посетителя для каждого варианта . Это было вычислено с использованием наших входных данных 80% мощности и 5% альфа (значимость 95%).Мы знали, что у нашего контроля коэффициент конверсии 14%, и ожидали, что наш вариант будет работать на уровне 19%:

    Таким же образом, если бы мы знали размер выборки для каждого варианта, альфа и желаемый уровень мощности (скажем, 80%), мы могли бы найти MEI, необходимый для достижения этой мощности — в данном случае 19%:

    Что делать, если вы не можете увеличить размер выборки?

    Наступит день, когда вам понадобится больше мощности, но увеличение размера выборки — не вариант. Это может быть связано с небольшим сегментом в текущем тесте или низким трафиком на странице.

    Допустим, вы вставляете свои параметры в калькулятор A / B-теста, и для этого требуется размер выборки более 8000:

    Если вы не можете достичь этого минимума — или на это потребуются месяцы, — один из вариантов — увеличить MEI. В этом примере увеличение MEI с 10% до 25% уменьшает размер выборки до 1356 на вариант:

    Но как часто вы сможете достигать 25% MEI? И какую ценность вы упустите, ища только масштабное воздействие? Лучшим вариантом обычно является снижение уровня достоверности до 90%, если вам удобна 10% -ная вероятность ошибки типа I:

    .

    Так с чего же начать? Георгиев признал, что аналитики CRO слишком часто «начинают с размера выборки (тест нужно проводить за <полу-произвольное число> недель)», а затем случайным образом толкают рычаги, пока результат не подходит.”

    Обеспечение правильного баланса:

    Заключение

    Статистическая мощность помогает контролировать ошибки, дает большую уверенность в результатах тестирования и значительно повышает вероятность обнаружения практически значимых эффектов.

    Воспользуйтесь статистической мощностью, следуя этим советам:

    1. Проведите тесты в течение двух-четырех недель.
    2. Используйте калькулятор тестирования (или G * Power), чтобы обеспечить правильное питание тестов.
    3. Отвечает требованиям к минимальному размеру выборки.
    4. Если необходимо, проверьте на наличие более значительных изменений эффекта.
    5. Используйте статистическую значимость только после выполнения требований к минимальному размеру выборки.
    6. Запланируйте достаточную мощность для всех вариантов и сегментов после тестирования.
    .
    Разное

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *