Шуман:
Зачем совершать свои ошибки, если до этого их уже совершили другие? Несколько лет назад была война между кланами АН в Москве. Там один клан убивал другой следующим образом: проанализировали базу на предмет распределения дисперсии по оси цен. И доказали, что такой дисперсии в природе не существует. А значит база пальцем пиханая. В ответ они продемонстрировали свою базу - красивейшее распределение - строго по БЕЛОМУ шуму. Наивные не знали, что распеределение должно быть по розовому шуму - дешевых вариантов больше, чем дорогих, т.е. с перекосом. Рыэлтеры такие рыэлтеры. И то, закон розового шума возникает статистически, при большом числе данных. Законы дисперсии малых баз куда как сложнее (и интереснее).
Вы знаете как анализировать дисперсию малой базы? Не думаю. Если бы дисперсия отражала настоящие данные, то закон распределения этих данных был бы интересен как фундамент для технического прогноза. В данном случае вы можете лишь доказать 100 % искуственность БД. И что? Это и так очевидно в моменты, когда знак движения цен в реальности и в базе противоположные. Эти моменты я здесь несколько раз отмечал. Да и без этого война меду кланами в Москве искуственность баз автодоказала.
Шуман, в корень зрите( Я даже не сказал про искусственность..) Устроить микрохапун на реалте можно, впросив 2-3 десятка (иногда надо больше) левых вариантов: медиана будет неделю расти. Ценник на верианты не должен быть запредельным: 1к по 50000 и ок. Учитывая, что по словам онкомы там (не помню точно) десятки процентов обьяв левые... Я вот и говорю: интересна дисперсия и интересна динамика. Ну и не тока дисперсия: гистограммы в динамике глянуть, ещё чего-нибудь.
Про розовый шум: Это то, про что Понижала писал: смещение в сторону дешовых вариантов. Очевидно же ж, что должно быть. По сути как с зарплатой, которую недавно обсуждали с 70 процентов меньше средней. В данных, которые Jiona уже представила, видно, что медиана меньше средней и будет вам это смещение, никуда не денется. Про белый шум в Москве они так что отожфли, да. Иль не ясно заранее, что элитного жилъя меньше чем дешового?
Про то, о чём был мой пост: розовый шум-- слишком примитивная модель (или просто слишком общие слова), Есть разделение на разные классы жилья по раёнам, качеству и т.д. Я же говорю: представьте город с 2мя раёнами: один по 1000 в среднем, дргуой по 2000 в среднем. В нём будет по 2000 очень легко больше вариантов, чем по 1500. В реальном городе тоже будут наблюдаться эти пики на больших стоимостях ИМХО. При сохранении в грубом приближении розовости, понятное дело.
Про то, могу ли я анализировать дисперсию в малых базах. Ну сомневаетесь-- сомневайтесь, я нигде и не кричу, что я мега-чего умею (ну там профессора Гарвардского заочно уесть или есчё чего). Но я с разной статистической обработкой плотно работаю, отнюдь не с ценами, правда, ни разу не с экономикой. Но, скажем так, есть вещи, которые а, имея реалт (всйи базу) в динамике, с удовольствием бы попробовал.