Доверителни интервали в Excel: стойност, определение, конструкция и изчисления

Разширените функции на Excel осигуряват незаменими и удобни методи за различни статистически изчисления и анализи. Една такава характеристика е доверителният интервал, използван за изразяване на степента на несигурност, свързана с изследването. Доверителните интервали в excel са оценка на събитията, съчетани с проверка на вероятността. Те осигуряват вероятен диапазон от пропорции на извадката или селективна средна стойност на истинския дял /средна стойност, намерени в популацията и показани като: score +/- error.

Функция на доверителния интервал

Във всяко проучване и проучване, доверителните интервали са чудесен начин да се разбере ролята на грешките в извадката в средните проценти. За всяко изследване, тъй като изследователите винаги изучават само частта от по-голямото изчисление, техните оценки са несигурни, което ще бъде грешката на извадката.


Доверителният интервал (CI) дава представа колко средната стойност може да варира. Той представлява диапазон от стойности, които са еднакво центрирани на известния среден размер на извадката. Колкото по-високо е нивото на доверие (в проценти), толкова по-малък е интервалът, толкова по-точни са резултатите. Изследването на проби с по-голяма променливост или големи стандартни отклонения генерира по-широки доверителни интервали в excel. Съществува съотношение на обратния квадратен корен между DI и размера на пробата. По-малките размери генерират по-широки CI, така че да се получи по-точнаоценките или намаляването на половината от пределната грешка, е необходимо да се увеличи размерът на пробата приблизително четири пъти.


Изграждане на среден набор от агрегати

За да се изгради доверителен интервал за средната популация от дадена вероятност, размерът на извадката, трябва да се приложи функцията "CONFIDENCE" в Excel, която използва нормалното разпределение за изчисляване на стойността доверие. Например изследователите избрали случайно 100 души, измерили теглото си и поставили средно 76 кг. Ако искате да знаете средната стойност за хората в конкретен град, е малко вероятно тя да има същата средна стойност за по-голяма група като извадка от само 100 души. Много по-вероятно е селективната средна стойност от 76 кг да бъде приблизително равна на (неизвестна) средна за населението и трябва да знаете доколко е точен отговорът. Тази несигурност, свързана с оценката на интервалите, се нарича ниво на надеждност, обикновено 95%. Функцията CONFIDENCE "(alpha, sigma, n) връща стойността, използвана за конструиране на средна съвкупност от агрегати.Предполага се, че данните от извадката отговарят на стандартни нормални разпределения с познато стандартно отклонение сигма, а размерът на извадката е n. excel 95% ниво, приемете алфа като 1 - 095 = 005.

Функционални формати на CONFIDENCE

Функцията CONFIDENCE или TRUST се определя от доверителните граници, което е долната и горната граница на CI и е 95% от индекса. Установено е, че 70% от хората в лъжи Боржомисрещу Пепси при CI 3% до 95% доверителен интервал, тогава има 95 процента вероятност, че истинската съотношението е 67-73%.
функции "CONFIDENCE" се появи под различен синтаксис в различни версии на Excel. Например, Excel 2010 има две функции: "DOVIRYT.NORM и DOVIRYT.T", които помагат на изчисляване на ширина "CI DOVIRYT.NORM." Се използва, когато се измерва стандартното отклонение е известно. В друг случай, "" оценката DOVIRYT.T се извършва по образец. Доверителни интервали в ексел до 2010 имаше само функция "ДОВЕРИЕ". Неговите аргументи и резултатите са подобни аргументи на функция "DOVIRYT.NORM". Първа на разположение в по-късните версии на Excel за съвместимост. #NUM! Грешка - случва, когато алфа-малко от или равно на 0 или е по-голямо от или равно на 0. Това стандартно отклонение по-малко от или равно на 0. определен размер аргумент е по-малка от единица. # СТОЙНОСТ! Грешка - възниква, ако някой от аргументите не са дадени редица.

доверието на функция интерполация

"Trust". класифицирани по функции и статистически данни ще се изчисли и да се върнат CI за средната стойност. Доверителни интервали в Excel могат да бъдат изключително полезни за финансов анализ. Като анализатор, "Trust". помага при прогнозирането и настройка за различни цели, като оптимизира финансови решения. Това се постига чрез използване на дисплей на данни в набор от променливи.
анализатори могат да вземат по-добри решения въз основа на статистически данни, предоставени от нормалнотодистрибуция. Например, те могат да намерят връзка между приходите и разходите, които те харчат за луксозни предмети. За да се изчисли средната стойност на съвкупност за CI, която връща стойност на доверие, тя трябва да бъде добавена от средната стойност на извадката. Например, за средния размер на извадката x: Trust interval = x ± TRUST. Пример за изчисляване на доверителния интервал в excel - предполагаме, че имаме следните данни:
  • Значение: 005.
  • Стандартно отклонение на населението: 25.
  • Размер на пробата: 100.
  • Функция Интервалът на доверие на Excel се използва за изчисляване на DI с стойност 005 (т.е. ниво на автентичност от 95%) за средното време на извадката за изучаване на времето за превключване в офис за 100 човека. Средният размер на пробата е 30 минути, а стандартното отклонение е 25 минути. Доверителният интервал е 30 ± 048999, което съответства на обхвата 29510009 и 3048999 (минути).

    Интервали и нормално разпределение

    Най-познатото използване на доверителния интервал е „грешка при грешка“. В анкетите грешката е плюс или минус 3%. ДИ са полезни в контекст, който надхвърля тази проста ситуация. Те могат да се използват с анормални разпределения, които са силно изкривени. За да се изчисли прогнозата на доверителния интервал в excel, се изискват следните градивни елементи:

  • Средно.
  • Стандартно отклонение на наблюдението.
  • Брой анкети в извадката.
  • Нивото на доверие, което трябва да се приложи към кредитни институции.
  • Преди да построят доверителния интервал в excel, те изучаватТя е около средния размер на извадката, като се започне с вземане на решение кой процент от другите съоръжения за проба да се приемат, ако са събрани и изчислени в този интервал. Ако е така, тогава 95% от възможните проби ще бъдат улавяни от КИ от 196 стандартни отклонения над и под пробата.

    Средна стойност на стандартната грешка

    Допустимият интервал или грешка не се приемат, като се вземе предвид грешката на измерването или отклонението на изместване, така че действителната несигурност може да бъде по-висока от посочената. Преди изчисляване на доверителния интервал в excel, изчислението трябва да бъде осигурено с добро събиране на данни, надеждни системи за измерване и задоволителен дизайн на изследването. Доверителните интервали за средната стойност могат да бъдат получени по няколко начина: използвайки SigmaXL, описателна статистика, хистограми, 1-t-тест и доверителни интервали, едностранни ANOVA и Multi-Vari диаграми. За графично илюстриране на CI за средното удовлетворение, те създават Multi-Vari диаграма (с 95% CI Mean Options), използвайки данни за клиентски данни .xls. Точките съответстват на отделни данни. Маркерите показват максимална доверителна граница от 99% и средно 95% лимит. Сега ще се използват хипотези за тестване, за да се осигурят по-точни средни оценки на удовлетвореността и да се определи статистическата значимост на резултатите.

    Изчисляване чрез SigmaXL

    Доверителните интервали са много важни за разбирането и вземането на решения по тях. За да изчислите CI за отделно съотношение, използвайте SigmaXL & gt; Шаблони и калкулатори & gt; основнитестатистически шаблони & gt; 1 интервал на доверителни отношения. Преди да откриете доверителния интервал в excel, изпълнете следните стъпки:
  • Отворете Data Client.xls.
  • Щракнете върху раздела Лист 1 или F4, за да активирате последния работен лист. Кликнете върху SigmaXL & gt; Статистически инструменти & gt; Описателна статистика.
  • Поставете отметка в квадратчето „Използване на цялата таблица с данни“.
  • Щракнете върху "Напред".
  • Изберете „Общо удовлетворение“, кликнете върху „Числови променливи данни“ (Y).
  • Изберете "Тип клиент", щракнете върху "Категория на групата" (X1). По подразбиране нивото на доверие е 95%.
  • Щракнете върху OK.
  • Отбележете, че доверителният интервал от 95% означава: Средно, действителният параметър на популацията (средно или стандартно отклонение) ще бъде в диапазона 19 пъти от 20. Ще бъдат представени на потребителите: 95% доверителен интервал за всеки брой. Средно (95% CI). Доверителният интервал от 95% от стандартното отклонение (95% CI Sigma - да не се бърка с нивото на качеството на Sigma Process).

    Статистика и нива на доверие

    Доверителният интервал не е число, в което истинската стойност на параметъра се намира точно. Всъщност произволната стойност в теорията може да приеме всички възможни стойности в законите на физиката. Интервалът на доверие всъщност е зоната, в която истината (неизвестната стойност на параметъра, който се изследва в популацията, е най-вероятно да е избраната вероятност.) Когато се използва, интервалът се основава на изчисляването на прага на доверие, границата на грешка и коефициента на запаса. excel, дефинирайте тези елементи, които зависят от негоот параметрите:
  • Променливостта на измерените характеристики.
  • Размер на пробата: колкото е по-голяма, толкова по-голяма е точността.
  • Методи за вземане на проби.
  • Ниво на доверие - s.
  • Нивото на доверие е гаранция за доверие. Например, при ниво на доверие от 90%, това означава, че 10% от риска ще бъде погрешен. По правило 95% доверителен интервал е добра практика. По този начин максималното ниво на достоверност е по-голямо, колкото по-голям е размерът на пробата. Факторът на маржа е показател, изведен директно от прага на доверие. Таблицата дава някои примери за най-често използваните стойности.

    Ниво на доверие s



    Коефициент на маржин при n & gt; 30



    80%



    128



    85%


    )
    144



    90%



    1645



    95%
    80)

    196



    96%



    205



    98%



    233



    99%



    2575

    за изчисляване

    В случаите, когато е необходимо да се изчисли средната стойност на популацията от неговата извадка, се определя доверителният интервал. Тя зависи от размера на пробата и закона на променливата. Формулата за изчисляване на доверителния интервал в excel изглежда така:
  • Долен граничен интервал = среден коефициент на полето * стандартна грешка.
  • Горната граница на обхвата = приблизителна средна + коефициент на полето * стандартна грешка.
  • Стойността на t ще зависи от размера на пробата: n & gt; 30: запас съотношението на нормалния закон, наречено z. n В тази ситуация самите единици са тамсредни стойности. Изследователят трябва да знае стандартното отклонение не от първоначалните и индивидуалните наблюдения, а от средствата, които се изчисляват въз основа на тях. Това отклонение има името - стандартна грешка на средната стойност.

    Грешки

    На графиките се използва вариабилност на данните, за да се посочи грешка или неопределеност на измерването. Те дават обща представа за това колко точно са измерванията, или, обратно, колко далеч от отчетената истинска стойност и са съставени под формата на честотни грешки. Те представляват едно стандартно отклонение на неопределеността, една стандартна грешка или определен интервал на доверие (например интервал 95%). Тези стойности не съвпадат, така че избраната мярка трябва да бъде посочена в графиката или в текста. Може да се използват честотни грешки за сравняване на две стойности, ако са изпълнени статистически значими условия. Линиите за грешки показват приемливостта на дадена функция, т.е. колко добре тя описва данните. Научните разработки в експерименталните науки включват грешки във всички графики, въпреки че практиката е малко по-различна и всеки изследовател има свой собствен стил на грешки. Лентите за грешки могат да се използват като интерфейс за директна манипулация за контролиране на вероятностни алгоритми за грубо изчисляване. Лентите за грешки могат да бъдат изразени като знак плюс или минус (±). Плюс е горната граница, а минус е долната граница на грешката.

    Калкулатор на критичната стойност

    За правилното определение на КИ има онлайн калкулатори, които са значителноопростяване на работата. Процесът на определяне на събирането на данни започва. Тя е в основата на всички изследвания. Надеждната извадка ви помага да взимате увереност в бизнес решенията си. Първият въпрос, който трябва да бъде разгледан, е правилното определяне на целевата група, то е от решаващо значение. Ако изследовател проведе изследване с хора извън тази група - не е възможно успешно да се изпълни задачата. Следващата стъпка е да се реши колко хора трябва да интервюират.
    Експертите знаят, че малка представителна извадка ще отразява мислите и поведението на групата, от която е съставена. Колкото по-голяма е пробата, толкова по-точно тя представлява целевата група. Независимо от това, скоростта на подобряване на точността намалява с увеличаване на размера на извадката. Например увеличение от 250 на 1000 двойна точност. Вземете решение относно размера на извадката въз основа на фактори като: налично време, бюджет и необходимата степен на точност. Съществуват три фактора, които определят размера на ИИ за това ниво на сигурност:
  • размер на извадката;
  • % от пробата;
  • размер на популацията.
  • Ако 99% от респондентите са казали "Да" и 1% са казали "Не", вероятността за грешка е малка, независимо от размера на извадката. Въпреки това, ако процентът е 51 и 49%, вероятността от грешка е много по-висока. По-лесно е да сте сигурни в крайните отговори, отколкото средните. Когато определяте размера на пробата, необходима за дадено ниво на точност, трябва да използвате най-лошия процент (50%). По-долу е представена формула за изчисляване на доверителния интервал в размер на извадката в Excelонлайн калкулатор.
    Изчисленията на доверителния интервал показват, че съществува действителна случайна извадка от съответната популация. Ако анкетата не е случайна, не можете да разчитате на интервали. Неслучайните проби обикновено възникват поради недостатъци в процедурата.

    Създаване на линейни диаграми

    Създаването на график на доверителен интервал в Excel е относително прост. Първо, създайте линейна диаграма. След това изберете „Инструменти за диаграми“ & gt; Оформление & gt; Панел за грешки & gt; "Разширени опции на панела". В изскачащото меню на диалоговия прозорец можете да изберете положителни или отрицателни ленти за грешки или и двете. Можете да изберете стил и да изберете сумата, която искате да покажете. Това може да бъде фиксирана стойност, процент, стандартно отклонение или потребителски диапазон.
    Ако данните имат стандартно отклонение по подразбиране за всяка точка, изберете интерфейса и кликнете върху бутона "Определяне на стойността". След това се появява друго изскачащо меню, можете да изберете диапазон от клетки за позитивни и отрицателни панели.
    Редът на конструиране на графиката:
  • Подгответе данните. Първо, в допълнение към средните стойности, ще се изисква стандартно отклонение (или грешка).
  • След това, в ред 4, е необходимо да се изчисли горната граница на групата, т.е. за В4 изчислението ще бъде: ) Създайте график. Маркирайте редове 124 и 5 от таблицата и след това кликнете върху „Поставяне“ & gt; График & gt; "Циркулярна диаграма".Excel ще създаде линейна диаграма.
  • Премахнете легендата и линията на решетката.
  • След това щракнете с десния бутон върху горната група от диапазони и изберете "Промяна на типа на диаграмата".
  • Форматирайте диапазоните на доверието. За да завършите графиката, просто форматирайте горната серия със синьо запълване (в съответствие със синята линия), а долната серия - бяла запълване.
  • В тази диаграма е лесно да се видят границите на грешките, но ако има много данни, видът ще бъде случаен. На пръв поглед, границата на доверие е много по-очевидна, като се вземе предвид средната стойност на извадката и тя ще стане все по-тясна, тъй като броят на пробите се увеличава.

    Свързани публикации