エグゼクティブサマリー
回帰分析は、不動産評価のためのより科学的なアプローチを提供します不動産ではあまりにも頻繁に、評価のプロセスは親指をしゃぶるという大げさな運動として出くわす可能性があります。全米リアルター協会加入者がやって来て、ことわざのタイヤを蹴ってから、「定量的」な洞察がほとんどない推定値を生成します。多くの人にとって、家は生涯で最大の金融投資になることを考えると、おそらく、所有する財産がもたらす感情的な愛着によってプロセスが悪化します。
しかし、この狂気には方法があります。まあ、正確には3つ。
ザ・ 同等の販売アプローチ は住宅用不動産で最も一般的であり、対象不動産の価値を決定するために同様の不動産の最近の販売を使用します。 「コンプ」の販売価格は、対象物件との差異に応じて調整されます。たとえば、同等の物件に追加のバスルームがある場合、バスルームの推定値が観測された販売価格から差し引かれます。
商業用不動産はより異質であると考えられているため、同等の販売アプローチはあまり使用されません。ザ・ 収入アプローチ 、資産の本源的価値はすべての割引キャッシュフローの合計に等しいという概念に基づいて、2つの方法でより一般的に適用されます。
最後のテクニックは 原価法 、同一の土地を取得し、対象不動産のレプリカを構築するコストに基づいて価値を見積もります。次に、プロジェクトのコストは、現在の状態に基づいて減価償却されます。 陳腐化 サブジェクトプロパティの。同等の販売アプローチの調整と同様に、目標は対象不動産を厳密に一致させることです。コストアプローチは、他の2つのアプローチよりも使用頻度が低くなります。
すべての従来の不動産評価方法は、評価に使用されるインプットの選択により、主観的です。たとえば、キャップレートの選択は、プロパティの評価に大きな影響を与えます。NOIが100万ドルのプロパティを評価する場合、キャップレートが4%増加すると(6%から10%に)、プロパティは40%増加します(下のグラフ)。
不動産評価に回帰モデルを使用することには多くの利点があります。小売業界はその使用を受け入れています サイト選択 、しかし、不動産業界は、ほとんどの場合、その潜在的な利点を見落としています。回帰分析は、大量のデータを分析するのに特に適しています。国内のすべての地元の不動産市場についての深い知識を持つことは事実上不可能ですが、回帰モデリングは検索を絞り込むのに役立ちます。
回帰モデリングを使用する最大の利点は、その固有の柔軟性です。他のモデルとは独立して、またはそれらと連携して機能します。
最も直接的なアプローチは、既存の販売データを使用して、モデルへの出力として対象不動産の価値を予測することです。地方、州、および連邦政府機関からの無料データのソースは多数あり、プライベートデータプロバイダーで補完することができます。
javascriptで日付を取得する方法
もう1つのオプションは、回帰モデルを使用して、他の従来の評価方法の入力をより正確に予測することです。たとえば、多目的商業プロジェクトを分析する場合、開発者は1つのモデルを作成して小売スペースの平方フィートあたりの売上を予測し、別のモデルを作成して住宅コンポーネントの賃貸料を予測できます。これらは両方とも、評価のための所得アプローチへのインプットとして使用できます。
健全な統計原則を使用すると、評価に対してより客観的なアプローチが得られます。回避するための最良の方法の1つです 確証バイアス 、これは、人々が既存の意見を確認する情報を探したり、それと矛盾する新しい情報を拒否したりしたときに発生します。私が小売業者が新しい店舗の売上を予測するためのモデルを構築したとき、多くの小売業者が競合他社の近くにいることで利益を得ていることを知って、彼らはしばしば驚いていました。実際、最大の競争相手であることが多いウォルマートとのコロケーションは、私のモデルで使用される最も一般的な変数の1つでした。既存の偏見に依存することは、機会を逃すことにつながる可能性があり、さらに悪いことに、すぐ近くに災害を隠す可能性があります。
統計的評価の客観的な利点のいくつかは次のとおりです。
回帰モデルは、精度のチェックが組み込まれているという点で独特です。全母集団のサンプルでモデルを構築した後、サンプル外のデータでモデルを使用して、可能性を検出できます。 サンプリングバイアス 。
従来の評価方法はすべて、 選択バイアス 。同等のプロパティを選択する場合、最良の結果を選択し、それらがプロジェクトに最も似ていると想定するという罠に陥るのは非常に簡単です。所得アプローチの収益率など、変数の予測にも重点が置かれています。この予測の必要性を排除することは、多くの不動産投資家にとって魅力的である可能性があります。そのため、回帰ベースの評価が有用なアプローチです。
を引用するジョークの量 さまざまなパーセンテージ 構成されている統計の多くは、それ自体が冗談です。私たちはほぼ毎日、新しい調査研究の結果に関するメディアの見出しに襲われています。その多くは、昨年発表された調査と矛盾しているようです。サウンドバイトの世界では、研究者が採用した方法の厳密さについて議論する時間はありません。
回帰分析には多くの種類がありますが、最も一般的なのは線形回帰です。モデルが有効であると見なすために違反してはならない線形回帰に関する特定の仮定があります。これらの仮定に違反すると、入力とモデル全体の予測力を計算する統計的検定が歪められます。
入力(独立変数)と出力(従属変数)の間には線形関係が必要です。たとえば、家の暖房された平方フィートとその全体的な値の間には線形関係があると想定できます。ただし、収穫逓減により、関係が非線形であり、生データの変換が必要であることがわかりました。
独立変数はランダムであってはなりません。簡単に言えば、モデル内の各独立変数の観測値は固定されており、測定に誤差がないと想定されています。たとえば、アパートの建物の価値をモデル化するためにユニット数を使用している場合、サンプルデータのすべての建物には、モデルの作成方法に関係なく、変更されない固定数のユニットが含まれます。
モデルの「残差」(つまり、モデルの予測結果と実際の観測値の差)の合計は0になります。つまり、使用するモデルは最適な線を表します。
モデルは、各独立変数のすべての観測値に対して正確である必要があります。平方フィートに基づいて住宅の価値を予測した場合、1,500平方フィート未満の住宅の値を予測するのに非常に正確であれば、このモデルは使用したくありませんが、3,000平方フィートを超える住宅には大きな誤差がありました。平方フィート。これは不均一分散として知られています。
不動産業界を見るときの線形回帰の最も一般的な問題の1つは、観測間の残余誤差の相関です。これは、パターンのないホワイトノイズと考えることができます。ただし、残差にパターンがある場合は、調整が必要になる可能性があります。この問題を概念化することは困難ですが、これが不動産業界で懸念される2つの主要な領域があります。
長期間の観測に基づいてモデルを構築することは、現在の値を予測するには不適切です。平均宿泊料金を独立変数として使用して、ホテルのプロパティの値を予測するモデルを作成したとします。客室料金は時間の経過とともに一貫して上昇しているため、この変数の予測力は誤解を招く可能性があります。統計的には、 自己相関 モデルでは考慮されない、時間の経過とともに正の傾向(つまりインフレ)を示す観測された平均客室料金の間。住宅用不動産で最も広く使用されている従来の比較可能な販売アプローチは、最新のデータのみを使用することでこの問題を排除します。商取引の数がはるかに少ないため、この時間制限により、同等の販売アプローチが無効になることがよくあります。ただし、自己相関の問題を克服できる線形回帰を使用する手法があります。
クラスター効果は、不動産評価のモデル化においても重要な課題です。これは次のように考えることができます 空間的自己相関 。この問題を考える最も簡単な方法は、高速道路の両側にある2つの近隣(AとB)の住宅の価値を予測するモデルを構築することを想像することです。全体として、モデルは値の予測にうまく機能する可能性がありますが、残余誤差を調べると、パターンがあることがわかります。近隣Aの住宅は一般に約10%過大評価されており、近隣Bの住宅は約10%過小評価されています。モデルを改善するには、このクラスター効果を考慮するか、近隣ごとに1つのモデルを構築する必要があります。
理想的には、モデル内の変数は相互に相関しません。既知のこの問題は 多重共線性 。地域のモールを評価するモデルへの入力として平方フィートと駐車場の数の両方を使用すると、多重共線性が示される可能性があります。計画コードでは、商業スペースの平方フィートに基づいて特定の数の駐車場が必要になることが多いため、これは直感的です。この例では、変数の1つを削除すると、予測力を大幅に低下させることなく、調整済みモデルをより正確に評価できます。
観察されたデータを使用することは、あらゆる経験的アプローチの中核ですが、過去の結果が常に将来を予測するとは限らないことを覚えておくことが重要です。不動産のような流動性の低い資産は、景気循環の変化に対して特に脆弱です。特定の変数の予測力は、現在の経済状況に基づいて変化する可能性があります。この問題は線形回帰に固有のものではなく、従来のアプローチでも見られます。
相関関係は因果関係と同じではありません。モデル構築の目的は、有効な予測を行う有用な変数を見つけることです。あなたは用心しなければなりません 疑似相関 。あることを知って驚くかもしれません 非常に強い相関 メイン州の離婚率とマーガリンの一人当たりの消費量の間。ただし、将来のマーガリンの売り上げを予測しようとしている場合は、メイン州の離婚データを使用しても意味がありません。
この知識を実際に適用して、最初から最後まで線形モデルを構築しましょう。この例では、一戸建て戸建住宅の価値を予測する不動産評価モデルの構築を試みます。 ペンシルベニア州アレゲニー郡 。アリゲイニー郡の選択は恣意的であり、実証された校長はどの場所でも機能します。 Excelを使用し、 SPSS 、これは一般的に使用される統計ソフトウェアです。
品質データを見つけることは、正確なモデルを構築するための最初のステップであり、おそらく最も重要です。 「ガベージイン、ガベージアウト」というフレーズを聞いたことはありますが、完璧なデータセットはないことを覚えておくことが重要です。私たちが快適に仮定できる限り、これは問題ありません サンプルデータ 全人口の代表です。不動産データの主なソースは3つあります。
この例では、以下から提供された無料のデータのみを使用します。 ペンシルベニア州西部地域データセンター そしてその 米国国勢調査局 。ザ・ アレガニー不動産販売 データは、販売価格を従属変数(Y変数)として使用した観測のベースファイルを提供します。また、を使用して変数をテストします ウォークスコア それぞれについて 国勢調査区 そして 税務査定 情報。
不動産モデルを作成するときに持つ非常に便利な変数の1つは、各住所の緯度と経度です。このデータは、住所を使用して緯度と経度を割り当てるジオコーダーを介して取得できます。ザ・ シラミ。国勢調査 オフィス ジオコーダー また、人口統計を集計するために一般的に使用される各場所の人口調査区を特定し、 サイコグラフィック 情報。
Javaユニットテストのベストプラクティス
データソースを選択したので、データの品質を調べる必要があります。データ品質をチェックする最も簡単な方法は、いくつかの主要な変数の度数分布表を実行することです。欠落または破損したエントリが多数ある場合は、データをさらに調査する必要があります。次の表は、216,498レコードのうち1つだけが、販売ファイルに欠落している郵便番号を持っており、99999や1X#45のような誤った郵便番号がないことを示しています。これは、これが高品質のデータセットであることを示している可能性があります。
に データディクショナリ 利用可能な場合は優れたリソースです。各変数が何を測定しているか、および変数の可能なオプションについて説明します。私たちのデータには、郡で行われた各販売の分析が含まれています。これは、特に生の証書レコードを扱う場合に重要な情報です。すべての不動産取引は、法律によって執行可能であるために記録されなければなりませんが、すべての譲渡が不動産の真の公正市場価値を反映しているわけではありません。たとえば、2人の家族間の販売は、贈り物の形として、または次のような高い取引コストの支払いを回避するために、市場価格を下回る可能性があります。 証書切手 。幸いなことに、地方自治体は、現在の市場価値を代表していないと思われる譲渡を明確にマークしているため、「有効な販売」を反映した記録のみを使用します。これらの売上は、トランザクションの総数の約18%しか占めておらず、分析に使用する前にデータを理解することがいかに重要であるかを示しています。私の経験に基づくと、この比率は証書の記録を分析するときに非常に一般的です。 「無効な販売」を含むモデルを作成した場合、最終結果が歪む可能性が高くなります。
次に、評価データとウォークスコアを販売ファイルに追加します。これにより、モデルに使用する単一のテーブルが得られます。この時点で、変数を分析して、線形回帰に適しているかどうかを確認する必要があります。以下は、さまざまなタイプの変数を示す表です。
私たちのファイルには、近隣や郵便番号など、順序の感覚なしにデータを分類するいくつかの公称値が含まれています。公称値は、なしの線形回帰には不適切です。 変換 。建設の品質、物件の現在の状態などを評価するいくつかの順序変数もあります。順序データの使用は、各ランクが等間隔であると合理的に想定できる場合にのみ適切です。たとえば、データには19の異なる分類(A +、A、A-など)のグレード変数があるため、これらのグレードは等間隔である可能性が高いと安全に想定できます。
モデルで使用する前に変換する必要のある変数もいくつかあります。に変換できる1つの公称値 ダミー変数 テスト用は、冷暖房変数です。エアコンのないすべてのプロパティとエアコンのあるプロパティの変数を0に設定します。また、表示するには、文字のグレードを数値に変換する必要があります(0 =最悪、1 =良い、2 =最高)。価格と線形関係がある場合。
ノードjsとPythonのパフォーマンス
最後に、すべての観測値を使用することが適切かどうかを判断する必要があります。一戸建て戸建住宅の価値を予測して、すべての商業用不動産、コンドミニアム、タウンホームをデータから除外できるようにします。また、自己相関の潜在的な問題を回避したいので、これが発生する可能性を制限するために、2017年の売上のデータのみを使用します。無関係なレコードをすべて削除したら、テストする最終データセットを用意します。
正しいサンプルサイズを選択するのは難しい場合があります。学術資料の中には、提案されている最小限の数とさまざまな経験則が幅広くあります。私たちの調査では、全体の人口が非常に多いため、サンプルを十分に確保することを心配する必要はありません。代わりに、サンプルが非常に大きいため、ほとんどすべての変数に 統計的有意性 モデルで。最終的に、レコードの約10%がモデリング用にランダムに選択されました。
変数選択は、統計ソフトウェアがなければ、プロセスの最も難しい部分の1つになる可能性があります。ただし、SPSSを使用すると、線形回帰に適していると判断した変数の組み合わせから多くのモデルをすばやく構築できます。 SPSSは自動的に 変数を除外する 統計的有意性のしきい値に基づいて、最良のモデルのみを返します。
サンプルデータから、SPSSは5つのモデルを作成しました。最も予測的だったモデルには、次の5つの変数が含まれていました。
SPSSの結果を見てみましょう。私たちの主な焦点は、最初は R二乗値 これは、従属変数(価格)の分散の何パーセントが回帰によって予測されるかを示します。可能な限り最良の値は1であり、このモデルの結果は非常に有望です。モデルの精度を測定する推定値の標準誤差は、73,091ドルと非常に高いように見えます。ただし、これをモデルの販売価格の標準偏差($ 160,429)と比較すると、誤差は妥当であるように見えます。
SPSSには、を使用して自己相関をテストするための組み込み機能があります。 ダービン-ワトソン検定 。理想的には、値は0から4のスケールで2.0になりますが、値1.652でアラームが発生することはありません。
次に、モデルの結果をテストして、不均一分散の証拠があるかどうかを判断します。 SPSSの組み込み機能はありませんが、これを使用します 大きい Ahmad Daryantoによって書かれ、Breusch-Pagan検定とKoenker検定を使用できます。これらのテストは、下のグラフの有意水準(Sig)が.005未満であるため、モデルに不均一分散が存在することを示しています。私たちのモデルは、線形回帰の古典的な仮定の1つに違反しています。ほとんどの場合、問題を排除するために、モデル内の変数の1つを変換する必要があります。ただし、これを行う前に、不均一分散が独立変数の予測力にどのような影響を与えるかを確認することをお勧めします。の使用を通じて 大きい Andrew F. Hayesによって開発されたもので、独立変数の調整済み標準誤差と有意水準を確認できます。
さらにテストを行うと、モデルの不均一分散を考慮した後、独立変数が統計的に有意なままであることがわかります。したがって、今のところ、必ずしもそれを変更する必要はありません。
最終テストとして、元のサンプルの一部ではなかったすべての販売記録をモデルでスコアリングします。これは、モデルがより多くのデータセットでどのように機能するかを確認するのに役立ちます。このテストの結果は、推定値の決定係数と標準誤差が大きなデータセットで大幅に変化しなかったことを示しています。これは、モデルが期待どおりに機能することを示している可能性があります。
実生活でサンプルモデルを使用する場合は、データをさらにセグメント化して、より正確な複数のモデルを作成するか、この単一モデルの精度を高めるために追加のデータを探します。これらの手順により、モデルに存在する不均一分散も削除される可能性があります。 100万人を超える郡の住宅の価値を予測するために単一のモデルを使用しようとしたという事実に基づいて、わずか数時間で「完璧な」モデルを構築できなかったのは当然のことです。 。
私たちの目標は、一戸建て戸建住宅の価値を予測するモデルを構築することでした。私たちの分析は、妥当な精度でその目標を達成したことを示していますが、私たちのモデルは理にかなっていますか?
私たちのモデルを説明すると、家の価値は、区画のサイズ、家の平方フィート、建設の品質、現在の修理状況、およびそれが持っているかどうかに依存していると言えます空調。これは非常に合理的なようです。実際、私たちのモデルを従来の評価方法と比較すると、土地を取得し、現在の陳腐化の状態に合わせて調整された新しい建物を建設するコストを追加するコストアプローチと非常に似ていることがわかります。ただし、この類似性は、回帰句を使用する場合、疑似相関である可能性があります。
通常、コストアプローチは のみ 古い物件の減価償却の適切な方法を決定する際に問題があるため、新しい物件の評価に推奨されます。このモデルを使用して、あらゆる年齢のプロパティに役立つ同様の戦略を作成しました。実際、年齢を独立変数としてテストし、プロパティ値に統計的に有意な影響を与えないと結論付けました。
うまくいけば、これまでに、回帰分析の基本をよりよく理解できたはずです。次の質問は:それはあなたのビジネスを助けることができますか?これらの質問のいずれかに「はい」と答えた場合は、回帰分析をツールとして使用することでメリットが得られる可能性があります。
上記のモデル例は、不動産で回帰モデリングを使用することの価値を簡単に示しています。データを収集してモデルを構築するのにかかった2〜3時間は、その潜在能力を十分に発揮するにはほど遠いものです。実際には、不動産業界では、不動産評価以外にも、次のようなさまざまな用途があります。
地理空間モデリングでは、回帰分析の原則と、不動産で最も重要な3つの要素(場所、場所、場所)を組み合わせて使用します。住宅開発者として8年間働いていることは、地理空間モデリングの力を証明することができます。使用する ArcGIS 、販売データ、区画マップ、およびを組み込むことができました。 対処する ノースカロライナの山での開発に理想的なプロパティを見つけるためのデータ。
私の経験によると、不動産のお金のほとんどは、プロジェクトの開発ではなく、買収で作られています。できる 他の人が逃している機会を特定する 不動産において大きな競争上の優位性になる可能性があります。地理空間分析は、大企業が長年利用してきたものですが、中小企業は見落としがちです。
統計を好きな科目として評価する人はほとんどいません。実際、全体として、人々は基本的なことさえ理解するのが非常に苦手です 確率 。この意見に疑問がある場合は、ラスベガスまたはマカオに旅行してください。残念ながら、これにより、プロセスに回帰分析を実装するためのアドバイスを探しているときに、誰を信頼するかを決定することが困難になる可能性があります。潜在的な候補者を評価するときに探すべきいくつかの重要な事柄があります
人々は確率を判断するのが苦手ですが、直感は実際にはむしろ 良い 嘘発見器で。 すべての質問に答えるモデルを構築できると主張する人には、非常に懐疑的である必要があります。結果の保証を信用しないでください。うまくいけば、この記事は、回帰分析が経験的観察と健全な科学に基づいているという事実を説明しています。特定の事柄が他の事柄よりも予測しやすいのは常に事実です。 A 信頼できるアドバイザー 彼らがあなたが探している答えを見つけることができないとき、彼らはオープンで正直になります、そして彼らはそこにないものを見つけようとしてあなたの予算を使い果たしません。
キャプテンカークの代わりにスポック氏を探してください。 健全な調査は優れたマーケティングツールになり得ますが、非常に多くの場合、人々は疑似調査の気配があり、それをバックアップするロジックがないセクシーなマーケティング資料にお金を払います。当然、より分析的な人もいますが、優れた分析スキルは実践から生まれます。理想的には、ビジネスのデータを分析するために雇う人は誰でも、さまざまな問題の解決策を見つけた経験があるでしょう。焦点が狭い人は、特に彼らの経験があなた自身の経験を厳密に反映している場合、集団思考の影響を受けやすくなる可能性があります。
彼らの推論能力を実証するのに役立つ質問でその場で潜在的な候補者を置きます。 今は行動の質問だけに頼る時ではありません。理想的な候補者は、既知の情報を戦略的に使用して、複雑な問題に対する答えを合理的に見積もることができます。 「エンパイアステートビルにいくつのテニスボールを入れることができますか?」などの論理的推論の質問をします。
CFOとは何ですか?
最後に、あなたはあなたがコミュニケーションをとることができる誰かを探すべきです。 世界のすべての情報は、それを有効に活用できなければ役に立ちません。紹介の会話で誰かがあまりにも多くの専門用語を使用して、あなたの目が釉薬をかけ始めた場合、それらはおそらくあなたの会社に適切ではありません。
回帰は、1つの従属変数(通常はYで示される)と他の一連の変化する(独立)変数の間の関係の強さを決定するのに役立ちます。これにより、過去のパフォーマンスに基づいて将来の結果に対して予測テストを実行できます。
4つのアプローチ、コスト、収入、同等の売上高、および回帰分析があります。
観測間の類似性が純粋にそれらの間のタイムラグの関数である場合です。いかなる種類の相関関係によるものでもありません
理想的には、モデル内の変数は相互に相関しません。その場合、既知のこの問題は多重共線性と呼ばれます。
変数の変動性が、それを予測している別の変数の値の範囲全体で等しくない場合。