Давайте разберем простенькую задачку на математическое ожидание и дисперсию,
совсем простенькую.
Значит, звучит она следующим образом: пользователь случайным
образом выбирает некую страницу из выдачи, в которой всего M страниц.
Вот есть M страниц в выдаче поисковика,
[ПИШЕТ НА ДОСКЕ]
и пользователь наугад, просто согласно классическому определению вероятности,
выбирает вот из этого множества M страниц какую-то одну.
Ну они занумерованы, понятно, они расположены как-то в топе, да, 1, 2,
3 и так далее.
Значит, пользователь наугад выбирает одну
страницу, наугад
выбирает страницу.
И вот давайте обозначим ξ случайную величину,
которая равна, собственно, номеру этой страницы,
выбранной пользователем, номер страницы.
Номер, повторяю, есть, потому что они как-то отранжированы поисковиком.
Номер страницы.
Ну спрашивается, чему равно матожидание ξ и чему равна дисперсия ξ.
Давайте напишем.
Нас интересует математическое ожидание ξ, и нас интересует дисперсия ξ,
— эти две характеристики такой вот простенькой случайной величины.
Ну давайте начнем с математического ожидания, и действовать здесь надо,
конечно, исключительно согласно обычному определению этого самого
среднего значения.
Что такое математическое ожидание вообще произвольной случайной величины,
как мы его определяли?
Ну там было 2 определения.
Одно — просто суммирование по всем элементарным исходам,
но было и вот такое: надо просуммировать по всем значениям,
которые принимает наша случайная величина, — эти самые значения, помноженные
на их вероятности, на вероятность того, что ξ принимает значение yi.
Но, смотрите, в нашей конкретной ситуации, когда у нас всего M
страниц выдачи и ξ — это просто номер страницы,
значения случайной величины совсем простые, — это просто номера этих страниц.
То есть в нашем конкретном случае, — вот это общее определение,
— а в нашем конкретном случае, когда ξ — это номер страницы в выдаче,
мы должны просто просуммировать по i от 1 до M вот это самое i на вероятность того,
что ξ принимает значение i, ну потому что значения случайной
величины — это просто числа от 1 до M, наши вот эти самые номера страниц.
Тут вообще ничего умного нет.
И вероятность того, что ξ принимает значение i, ну, она у нас классическая,
это вероятность того, что человек выбрал именно i-тую страницу из M.
Ну так он их равновероятно выбирает, ему все равно какую взять: 10-ю,
25-ю или 1-ю, он считает, что это без разницы.
Но тогда, конечно, у нас получается Σ по i от
1 до M i умножить на 1/M.
Это вот вероятность взятия конкретной страницы из M возможных.
1/M благополучно выносится за скобку,
в скобках остается Σ по i от 1 до M значений i.
Это банальная арифметическая прогрессия, которая, конечно,
равна M * (M + 1)/2, это я сосчитал сумму.
И еще надо поделить на M.
Шлеп, шлеп.
Получаем (M + 1)/2.
И это мы таким образом полностью нашли значение математического ожидания.
Ну нам еще надо найти все-таки дисперсию.
Давайте посмотрим, Dξ.
Воспользуемся удобной второй формулой для вычисления дисперсии,
не собственно определением, а вот именно вот такой
формулой: Mξ² – (Mξ)², была у нас такая формула с вами на лекции.
Mξ мы знаем, вот оно посчитано, это (M + 1)/2,
то есть мы имеем вот этот второй момент: – (M + 1)²/4.
И осталось сосчитать второй момент.
Ну что значит сосчитать второй момент?
Ну это опять надо действовать по определению.
Что такое Mξ²?
Это надо просуммировать по тем значениям, которые принимает величина ξ²,
— эти значения, помноженные на их вероятности, ничего не поменялось.
Ну, давайте: Σ по i от 1 до M, — естественно,
ξ² принимает значение, равное квадрату значения ξ, — то есть i².
Ну, и это надо, конечно, помножить на вероятность того,
что просто ξ принимает значение i.
Здесь такая перезапись представляется абсолютно очевидной.
И вероятность того, что ξ = i — это по-прежнему 1/M,
которое как и раньше можно благополучно вынести за знак суммирования.
В сумме останется от 1 до M уже i².
Ну такую сумму школьники зачастую тоже умеют считать, я в комбинаторике обычно
рассказываю, с помощью некоего тождества можно ее доказать красиво как следствие.
Значит, сумма квадратов чисел,
первых M чисел натурального ряда, — давайте 1/M запишем,
— это есть просто M * (M +1) * (2M + 1)/6.
Ну, сейчас я это доказывать не собираюсь, конечно, смотрите курс комбинаторики,
который вполне предшествует тому, о чем сейчас идет речь.
M сокращается, и мы получаем (M
+1) * (2M + 1)/6.
Соответственно, дисперсия, таким образом,
равна (M +1)², нет,
извините, (M + 1) * (2M + 1) /6
– (M +1)² /4.
Ну, наверное, можно вынести сейчас (M + 1) за скобку,
попробовать там привести какие-то подобные слагаемые.
Получится, конечно, покрасивее,
но я этого делать не буду, потому что суть-то вероятностную я изложил,
а уж там привести подобные — это каждый при желании сможет сам.