Уточнение статистики средней стоимости квадратного метра жильяАнализируя рынок недвижимости, мы работаем с массивом данных, данные в котором чаще всего были получены на основании субъективных заключений и выводов, а следовательно мы не можем использовать их в чистом виде для получения каких-либо выводов. Рассмотрим на гипотетическом примере поведение средней величины при внесении в множество неадекватной величины. Допустим, что в данный момент на продажу выставлены квартиры со следующими ценами и площадями:
Для расчета средней стоимости квадратного метра по абсолютному значению нам достаточно суммировать цены, суммировать метры и разделить суммированную цену на суммированную площадь. Рассчитаем стоимость квадратного метра для каждой квартиры и сопоставим результаты со средним значением.
Среднее значение стоимости квадратного метра = 53 514 руб. Таким образом, все наши квартиры находятся в относительной близости к среднему значению, и вероятность появления подобного объявления довольно велика. Но давайте попробуем добавить "неадекватное предложение к уже имеющимся.
Стоимость квадратного метра в данном предложении составляет 83 382 руб., что более чем на 50% превышает средний показатель, полученный до добавления данного объявления. Если мы пересчитаем средний показатель, он составит 60 981 руб. Таким образом, одно единственное предложение с неадекватной для данного сегмента ценой подняло среднюю стоимость квадратного метра почти на 14%. Естественно, что в реальной жизни преобладают относительно адекватные предложения, но закрывать глаза на крайности все же не стоит. Отдельно хочется отметить, что мы не можем суммировать только отличающиеся друг от друга значения стоимости квадратного метра. При суммировании мы должны учитывать вес каждого значения, и, в зависимости от всех весов всех значений, получать результирующее среднее взвешенное значение. Среднее взвешенное получают по формуле: Для примера, посмотрим на график разброса средней стоимости квадратного метра на вторичном рынке недвижимости Екатеринбурга. Как мы видим, основная масса предложений лежит в единой области, которая пусть и разрознена, но имеет определенные границы. Наша задача состоит в том, чтобы максимально снизить влияние "хвостов" на общую статистику, т.к. для определения среднестатистиских показателей мы не можем использовать исключительные крайности. Но сложность заключается втом, что мы не можем просто взять и обрезать края, т.к. в этом случае данные буду не полными. Каждое конкретное предложение должно быть оценено и либо принято к использованию в статистике, либо удалено из множества. Для проведения подобных исследований существует прекрасная Теорема Бернулли: С её помощью мы можем определить является ли каждое предложение "адекватным" с определенной вероятностью. При анализе каждой позиции мы можем использовать, как соотношение всех данных к оцениваемой величине, так и связывать анализируемую позицию с "соседями". Таким образом мы можем получить вероятность "адекватности" каждого предложения на рынке. Далее нам необходимо отбросить те значения, которые по нашему предположению не являются "адекватными", но выбросить те из них, которые допустим адекватны с вероятностью всего лишь 1/100 или 1/1000 нельзя. Мы должны учитывать, что малая вероятность существования подобного предложения может быть вызвана малым массивом значений, а следовательно нам необходимо найти баланс между долей адекватности значений и неопределенностью малого числа наблюдений. Здесь нам поможет нижняя граница доверительного интервала Вильсона для параметра Бернулли: По данной формуле мы можем рассчитать вероятность "адекватности" данного предложения, сопоставив его вероятностные характеристики с вероятностными характеристиками "соседей", принимая их преобладание за отризательные характеристики и наоборот. Если полученная в результате вероятность не достигает определенной величины, которую мы не станем раскрывать, мы отбрасываем данное предложение и не используем его при расчете средней стоимости квадратного метра в заданном сегменте рынка. Отдельно хотим отметить, что мы не применяем наши методы для всего массива данных в целом, а сегментируем множество по определяющим признакам, обрабатываем каждый сегмент в отдельности, и только после этого составляем единое множество обработанных данных. P.S. В данный момент мы стараемся накопить как можно больше данных для анализа, и постараемся в будущем внедрить более глубокие методы оценки вероятностей. Так же мы работаем над формированием коэффициентов, влияющих на оценку недвижимости. Следите за новостями.
| Последние новости16 апреля 2016, 23:59:18
Россияне ищут новые способы решения проблемы жилья
В современных сложных экономических условиях у граждан страны практически нет возможности купить недвижимость на свободные деньги. Для приобретения новой квартиры приходится сначала продать старую. Эта схема называется трейд-ин. "Экономика пока....
16 апреля 2016, 23:56:30
В России уменьшился профицит торгового баланса
За I квартал 2016 года объем импорта снизился на 15,4% и составил $37,8 млрд по сравнению с $44,7 млрд в I квартале 2015 г. Объем экспорта за это время сократился на 34,3% по сравнению с тем же периодом 2015 г....
16 апреля 2016, 23:54:45
Величина реальных налогов в России
Пусть никого не обманывает официальный подоходный налог в размере 13%. На самом деле скрытые платежи в покупках и зарплате значительно увеличивают реальную налоговую нагрузку на граждан страны. В настоящее время средняя зарплата в стране составляет....
16 апреля 2016, 23:52:56
Улучшился прогноз по рублю
Аналитики Goldman Sachs Group и JPMorgan считают, что стоимость нефти прошла свой минимум. "Мы считаем, что Россия станет выгодным источником вложения средств до конца года. По нашему мнению, нефть уже нащупала дно, и Центробанк сумеет справиться...
10 апреля 2016, 15:59:58
США ждет рецессия
Так считает аналитик банка Societe Generale Альберт Эдвардс. "Несмотря на то что с рисковыми активами уже несколько недель все спокойно, лампочка на нашем аварийном индикаторе, предупреждающем о рецессии, перестала мигать желтым светом и теперь горит...
|