回帰モデルの適切性をチェックします。 モデルの適切性の評価.docx - モデルの適切性の評価
経済数学モデルの構築の種類や方法に関係なく、経済現象の分析と予測を目的としたその使用の可能性の問題は、確立した後にのみ解決できます。 適切性、 それらの。 モデルと研究対象のプロセスまたはオブジェクトとの対応関係。 モデルと実際のプロセスまたはオブジェクトとを完全に対応させることはできないため、適切性はある程度条件付きの概念です。 モデル化する場合、適切性とは一般的なものではなく、研究に不可欠であると考えられるモデルの特性という観点から意味します。
傾向モデル、特定の時系列 そうだ、 時系列の体系的な構成要素を正しく反映している場合には、適切であると考えられます。 この要件は、残留成分が (t = 1, 2, ..., n ) パラグラフ 4.1 で指定された時系列のランダム要素の特性を満たしていること: 残差系列のレベルの変動のランダム性、ランダム要素の分布の正規分布則への準拠、ランダム要素の数学的期待の等価性コンポーネントをゼロに、ランダムコンポーネントのレベルの値に依存しません。 残差シーケンスのこれらのプロパティがどのようにチェックされるかを考えてみましょう。
残差系列レベルの変動のランダム性の確認トレンド タイプの選択の正しさに関する仮説をテストすることを意味します。 傾向からの逸脱のランダム性を研究するために、一連の差分を用意します。
これらの偏差の性質は、多数のノンパラメトリック テストを使用して研究されます。 その基準の 1 つは、 シリーズ基準、 サンプル中央値に基づきます。 一連の量 え、 昇順に並べて中央値を求めます εt 結果として生じる変動系列、つまり 奇数の場合の中央値 ぷ、 または 2 つの中央値の算術平均。 n 平 元のシーケンスに戻る εt このシーケンスの値をと比較します εt、 値が次の場合はプラス記号を付けます εt 中央値を超えている場合はマイナス記号が付き、中央値より小さい場合はマイナス記号が付きます。 比較した値が等しい場合、対応する値 εt 落ちる。 したがって、プラスとマイナスで構成されるシーケンスが得られますが、その合計数は次を超えません。 p. 連続するプラスまたはマイナスのシーケンスを呼びます。 シリーズ。 シーケンス e がランダム サンプルであるためには、最長のシリーズの長さが長すぎてはならず、シリーズの総数が小さすぎてもいけません。
最長の系列の長さを次のように表します。 に 最大 , シリーズの総数 - ν まで。 5% の有意水準で次の不等式が満たされる場合、サンプルはランダムであると見なされます。
(5.8)
どこ 角括弧数値の整数部分を意味します。
これらの不等式の少なくとも 1 つが破られた場合、傾向からの時系列レベルの偏差のランダムな性質に関する仮説は拒否され、したがって傾向モデルは不適切であると認識されます。
このチェックのもう 1 つの基準は次のとおりです。 ピーク(転換点)の基準。 シーケンスレベル εt 隣接するレベルが 2 つ以上ある場合、つまり、最大値とみなされます。 ε t-1 < εt > ε t+1 、両方の隣接するレベルよりも小さい場合は最小値、つまり ε t-1 >εt < ε t+1 。 どちらの場合も εt 転換点と考えられています。 残差シーケンスのターニングポイントの総数 εt で表す r. ランダムなサンプルにおける、転換点の数の数学的期待値 r と分散 σ2 p は次の式で表されます。
有意水準 5% のランダム性基準、つまり 95% の信頼確率で、不等式が満たされます。
ここで、角括弧は数値の整数部分を示します。 この不等式が満たされない場合、傾向モデルは不適切であると考えられます。
16)) 記述統計の基本特性、それらに基づく分析と結論、STATISTICA PPP での計算。
StatSoft が開発した「STATISTICA」システムは、最も人気のあるシステムの 1 つです。 統計プログラムパターンの発見、予測、分類、データの視覚化に使用されます。 経済、産業、医学、科学研究、その他の人間活動の分野で使用できます。 StatSoft クライアントは、 最大手の企業世界的な名声を持っています。 このシステムには、古典的な機能と 最新の方法データ分析の実施: クラスター、因子、相関、分散分析、線形および非線形回帰、 ニューラルネットワーク初期、中間、出力データの視覚化は、多数の異なるグラフ、絵文字、図表から選択して実行できます。
1. コマンドを選択します: ファイル - 新しいデータ -
2. [ファイル名] ウィンドウでファイル名を指定します。(例) descript - OK。 新しく作成された descrip.stat ファイルのグリッド テーブルが画面に表示されます。 テーブルのヘッダーには、名前とデフォルトの次元が示されます: 10v * 10c - (10 個の変数 (変数) - 10 個の観測値 (ケース) の列 - 行。
3. テーブルを寸法 1'50 に変換します。これを行うには、メニュー バーで [Vars] ボタンをクリックし、[削除] コマンドを選択します。 「変数の削除」ウィンドウ: 変数を指定します。 列変数削除: 変数から: var 2、変数へ: var 10 - OK メニュー バーの [ケース] ボタンをクリックし、[追加] コマンドを選択します - [ケースの追加] ウィンドウ: 追加する行数と場所を指定します: 追加するケースの数: 40、 Case の後に挿入: 1 (例) - OK。
17)) データファイルの作成。 STATISTICA PPP の記述統計の要素
データ ファイルの作成 1'50 テーブルを含むファイルを作成するには
4. コマンドを選択します: ファイル - 新しいデータ -
5. [ファイル名] ウィンドウでファイル名を指定します。(例) descript - OK。 新しく作成された descrip.stat ファイルのグリッド テーブルが画面に表示されます。 テーブルのヘッダーには、名前とデフォルトの次元が示されます: 10v * 10c - (10 個の変数 (変数) - 10 個の観測値 (ケース) の列 - 行。
6. テーブルを寸法 1'50 に変換します。これを行うには、メニュー バーで [Vars] ボタンをクリックし、[削除] コマンドを選択します。 [変数の削除] ウィンドウ: 削除する変数列を指定します: 変数から: var 2、変数へ: var 10 - OK メニュー バーの [ケース] ボタンを使用して、[追加] コマンドを選択します - [ケースの追加] ウィンドウ: 追加する行数を指定し、ここで: 追加するケースの数: 40、ケースの後に挿入: 1 (例) - OK。
データがそれほど多くない場合は、キーボードから入力できますが、大きなデータ表は Microsoft Excel からコピーすることをお勧めします。
注: STATISTICA 6.0 パッケージでは、Microsoft Excel と同様に、表のセルで直接計算を実行できることを忘れないでください。
データファイルを保存しています。 作成したファイルを保存するには、コントロール パネルの [保存] ボタンをクリックするか、キーボードで CTRL+S を入力します。 作成されたファイルは保存され、いつでも利用できるようになります。
「スタティスティカ8.0」
処理対象のデータが入力されます 表形式ケースや変数など。 ケースは、入力されるデータ テーブル (スプレッドシート) の行です。 データ テーブルは、他のソフトウェア パッケージで使用するためにインポート、変更、保存、およびエクスポートできます。
データ テーブルの各ケースは、一連のパラメーターによって特徴付けられます。 ケース番号は対応するデータ列に表示され、各ケースのパラメータ値は表の対応する番号付き列に表示され、非アクティブな変数領域は濃い灰色で示されます。
記述統計のパラメーターを計算するための「Statistica」の機能を検討する便宜のために、それぞれに 2 つのパラメーター (たとえば、身長と体重) の 100 ケースのデータ テーブルを作成します。 データ テーブルを作成するには、[ファイル] – [新規]をクリックし、開いた[新しいドキュメントの作成]フォームで、対応するフィールドの値を設定します:変数の数 – 2およびケースの数 – 100。 [OK]をクリックします。 2 × 100 の空のテーブルが得られます。
変数名var1を左ボタンでダブルクリックして変数名を変更しましょう。 [変数 1] フォームが開きます。名前フィールドに値「高さ」を入力し、[OK] をクリックします。 変数名が「Growth」に変わります。
Statistica プログラムは分析モジュールのセットとして提供されますが、バージョンとライセンスの種類によって大きく異なる場合があります。 記述統計モジュールは「コア セット」に含まれており、すべてのバージョンに含まれています。 このモジュールを起動するには、「Statistica – Basic Statistics/Tables」をクリックします。 「基本統計/テーブル: スプレッドシート 1」フォームが開きます。そこで、「記述統計」リスト項目をダブルクリックします。 これらの操作の結果として、記述統計モジュールのフォームが起動されます。 「詳細設定」タブに移動しましょう。
定量的データを説明するために使用できる、前に説明した記述統計パラメータの横にあるボックスをチェックしてみましょう。 次に、計算に使用する変数を選択する必要があります。[変数] ボタンをクリックします。 [分析用の変数を選択] ダイアログ フォームが開きます。 開いたフォームで、Ctrl キーを押しながらマウスの左ボタンをクリックし、「身長」と「体重」を選択して、「OK」をクリックします。
記述統計のパラメータを計算するには、「概要」をクリックします。 Statistica プログラムでのデータ出力は、いわゆるワークブックで実行されます。 ワークブックには計算結果のデータが含まれており、グラフや統計テストの結果も表示されます。 ワークブックは、他のプログラムで再利用するために保存、変更、エクスポートできます。 この特定のケースでは、次のようになります。 ワークブック Workbook1 という名前の
18)) STATISTICA パッケージでの多次元データの表現 データの標準化。
多次元 統計的手法多くの可能な確率統計モデルの中から、適切なものを合理的に選択できるようになります。 可能な限り最善の方法で限られた統計資料に基づいて作成された結論の信頼性と精度を評価するために、研究対象の対象集団の実際の動作を特徴付ける初期統計データに対応します。
社会経済的なプロセスと現象は、それらを特徴付ける多数のパラメーターに依存するため、これらのパラメーター間の関係の構造を特定することが困難になります。 このような状況では、つまり 確率的で不完全な情報の分析に基づいて意思決定が行われる場合、多次元手法の使用 統計分析それは正当化されるだけでなく、不可欠でもあります。
多変量統計手法を使用すると、多くの可能な確率統計モデルの中から、研究対象の対象集団の実際の挙動を特徴付ける初期統計データに最もよく対応するモデルを合理的に選択し、そのモデルから得られた結論の信頼性と精度を評価することができます。限られた統計資料に基づいています。
数学的統計の応用分野には、多数のオブジェクトの代表として、個人、家族、その他の社会経済的または生産単位の行動の研究に関連するタスクが含まれる場合があります。
多変量経済分析および統計分析は、幅広い手法に依存しています。 で 教科書最もよく使用されるいくつかの手法、つまり因子分析、クラスター分析、判別分析について説明します。
考慮されたオブジェクト、主題、または現象の集合を、ある意味で均質なグループに分割することを目的とした多次元分類の方法。 検討中の各オブジェクトの特徴を考慮する必要があります 多数の異なる、確率的に関連する特徴。 このような複雑な分類問題を解決するには、クラスター分析と判別分析が使用されます。 オブジェクトの機能プロセスを特徴付ける多くの初期特徴が存在するため、最も重要なものを選択し、より小規模な指標セットを研究する必要があります。 多くの場合、元のフィーチャは何らかの変換を受けて、情報の損失を最小限に抑えます。 このような解決策は、因子分析を含む次元削減法によって提供できます。 この方法により、データの大きな多次元性の影響を考慮することができ、多次元構造を簡潔かつ簡単に説明することが可能になります。 取得された因子または主成分を使用して、直接観察できない客観的に存在するパターンを明らかにします。
これにより、観察された初期データ、それらの間の関係の構造と性質を非常に簡単かつ正確に記述することが可能になります。 情報の圧縮は、要素または主成分(新しい測定単位)の数が元の特性よりも大幅に少なく使用されるという事実によって得られます。
全て リストされた方法統計アプリケーション パッケージを積極的に使用すると最も効果的です。 これらのパッケージを使用すると、欠落したデータなどを回復することも可能です。標準的な統計データ処理メソッドは、Excel、Lotus 1-2-3、QuattroPro などのスプレッドシートや数学パッケージに含まれています。 汎用、たとえば Mathcad です。 しかし、多くの 素晴らしいチャンスほとんどの機能を使用できるようにする特殊な統計パッケージがあります。 現代の手法データ処理のための数学的統計。 国際統計協会の公式データによると、統計ソフトウェア製品の数は 1,000 に近づいています。 その中には、数学的統計の手法に精通したユーザーを対象とした専門的な統計パッケージと、数学的訓練を十分に受けていない専門家が使用できるパッケージがあります。 パッケージには国産のものと海外のプログラマーが作成したものがあります。 変化する ソフトウェア製品そして価格によって。
の間で ソフトウェア このタイプの高度に特殊化されたパッケージ、主に統計的なパッケージ (大規模なセットを持つ STATISTICA、SPSS、STADIA、STATGRAPHICS) を区別できます。 統計関数:因子分析、回帰分析、クラスター分析、 多変量解析これらのソフトウェア製品には通常、得られた結果を視覚的に解釈するためのツールも含まれています。 さまざまなグラフィック、図、地理地図上のデータの表示。
データを分析する場合、統計ユーザーは ソフトウェアパッケージ計算をしなければならない 広い範囲統計学者は、分析のためにデータを転送および変換し、得られた結果を視覚的な形式で表示します。 したがって、パッケージを比較するために特定の統計パッケージを選択するときは、まず次のような特性に注意を払う必要があります。
データ管理の容易さ (データのエクスポート/インポート、データの再構築)。
統計的多様性 (統計モジュールの数)。
グラフィック機能(内蔵グラフィックエディタの利用可能性、表示機能 個々の要素グラフィックス、グラフをエクスポートする機能)。
その上、 大きな価値パッケージの操作の利便性、開発の容易さ (組み込みのヘルプ システム、ユーザー マニュアルの存在、データ、計算結果、表、グラフの管理の容易さの程度)、および速度が優れています。計算。
非統計的なパッケージもあります。 問題解決分類 (PolyAnalyst、DA システム、ARGONAVT、LOREG、OTEKS パッケージ、およびさまざまなニューラル ネットワーク パッケージ)。
多変量統計の基本概念 (簡単に)。 ランダムなベクトル。 正規ランダムベクトル。 正規ランダムベクトルの線形変換。 平均ベクトルと正規ランダム ベクトルの共分散行列の最尤推定値。 カイ二乗分布の多変量一般化: ウィシャート分布。 スチューデント分布の多変量一般化: T 2 -ホテリング分布。 Fisher-Snedecor 分布との接続。 平均が指定された値と等しいという仮説を検定するための多変量検定。 2 つのサンプル間のマハラノビス距離。 マハラノビス距離分布。 2 つのサンプルの平均値が等しいという多変量仮説をテストします。 一般原則最適な多変量統計検定は尤度比検定です。 ウイルクの定理。 例。 多次元のケースの詳細。 尤度比検定の使用に関する計算上の側面。 尤度比最適化手順。 数値的な実装。 尤度比検定の長所と短所。 主な仮説を棄却する理由を特定する問題。 別のアプローチ。 多次元ランダム ベクトルを 1 次元部分空間に投影します。 クラマー・ウォルドの定理。 予測のための仮説検定。 一般的な結論。 観察結果が主な仮説から逸脱する方向の特定。 和集合テスト。 メリットとデメリット。 計算問題。 計算問題を解決する手段としてのシミュレーション モデリング (モンテカルロ法)。 平均値の等価性に関する仮説を検証する k次元の独立したベクトル サンプル p。 尤度比検定 (Wilks Λ 検定)。 和集合テスト。 変動分析(分散分析)との関連。 でのテストの実施 コンピュータパッケージデータ分析。 MatLab システムの利点。
19)) 相関係数の定義と経済的解釈と決定 STATISTICA パッケージでの相関行列の構築とパッケージ ツールを使用したその分析
相関係数は相関比、2 つの確率変数間の相関関係の数学的尺度。 1 つの確率変数の変化が別の確率変数の定期的な変化にはつながらないが、別の確率変数の変化にはつながる場合 統計的与えられた確率変数の特性の場合、そのような関係は考慮されません 相関、そうですが 統計的.
相関関係には正の場合も負の場合もあります (独立した確率変数など、統計的な関係がない可能性もあります)。 負の相関 - 相関。1 つの変数の増加が別の変数の減少と関連しており、相関係数は負です。 正の相関 - 相関。1 つの変数の増加が別の変数の増加と関連しており、相関係数は正です。
自己相関- 同じ系列の確率変数間の統計的関係ですが、シフトして取得されます。たとえば、 ランダムなプロセス- タイムシフトあり。
変数間の係数(相関関係)を調べる統計データの処理方法は、と呼ばれます。 相関分析.
相関係数または ペア相関係数確率理論と統計において、これは 2 つの確率変数の変化の性質を示す指標です。 相関係数は次のように表されます。 ラテン文字 R は -1 から +1 までの値を取ることができます。 絶対値が 1 に近い場合、強いつながり (相関係数) が存在することを意味します。 1に等しい機能的な接続について話します)、0 に近い場合は弱いことを示します。
モデルがどれほど複雑で完全であっても、それは実際のオブジェクトの近似表現であり、受け入れられている特定の仮定の下でそれを反映しています。 ただし、実際の状況に対するモデルの適切性が証明されるまでは、研究対象のオブジェクトの機能を真に特徴付ける結果が得られるかどうか自信を持って言うことはできません。 シミュレーションを含むあらゆる種類の数学モデルの適切性と正確性を評価することは、 最も重要な任務不適切なモデルに関する研究は無意味になるため、モデリングを行う必要があります。
モデルの適切性と精度が向上するにつれて、そのコストと研究価値の両方が増加するため、モデルのコストと、モデルの不十分さによる誤った決定の結果との間の妥協の問題を解決する必要があります。研究中のプロセス。 したがって、実際には、モデルの構築は、これが合理的であると考えられる限り、モデルのシステムを改善する反復的なプロセスであり、したがってオブジェクトの研究となります。 したがって、モデルの適切性と精度の評価は、研究の開始から始まる継続的なプロセスです。 モデルの構築が正しいかどうかは、実際には「モデルの構築 - モデルの確認」のサイクルを繰り返すことによってのみ検証できます。
モデルの適切性の概念には定性的な側面がないことに注意してください。つまり、モデルは現象に対して適切であるか、適切でないかのどちらかです (当然、判断を行う人、つまり顧客の観点から)。 概念モデルから数学モデルへの移行の精度の定量的評価について話します。 オブジェクトに適切な特定の数学的モデルのコンピュータ上での実装の精度の定量的評価についてのみ話すことは正当です。 この場合、当然のことながら、数理モデルに従って計算を実行するプログラムに誤りがなく、初期データが正しく機械に入力され、計算過程でコンピュータに誤動作がなかったことが前提となります。 概念的モデルが研究中のプロセスに適切であり、数学的モデルが概念モデルに適切であり、コンピューター上での数学的モデルの実装の精度が指定された精度に対応している場合、モデルは信頼できます。 計算誤差は許容範囲を超えない
概念モデルを作成する際の主な間違いは次のとおりです。
基準や制限の選択が間違っている。
概念モデルへの重要でない要素の導入、またはその中に多くの重要な要素の欠如。
施設のさまざまな稼働条件を考慮に入れていない。
モデルの構造の基礎となる仮説の選択が間違っている (たとえば、オブジェクトの要素の構成、機能の過程における要素間の接続など)。
モデルの基礎となる原理の評価は主観的なものであるため、概念モデルの適切性を検証することはかなり困難な作業です。 最良の方法概念モデルの適切性のチェックは、開発に参加していない専門家によるモデルの検討(モデルの検討)であり、問題をより客観的に検討し、気付くことができるためです。 弱点著者が気づいていないモデル。 概念モデルの妥当性に関する最終決定は顧客によってのみ行われ、顧客はコンセプトを承認する際に、モデルの基礎となるすべての仮定を承認することになります。
概念モデルから数学モデルへの移行における主な基本的なエラーは次のとおりです。
数学モデルの構造は概念モデルの構造に対応していません。
モデルには誤った数学的関係が含まれています。
数学的モデルが開発されたら、プログラミングを開始する前に、使用される方程式またはモデリング アルゴリズムが概念モデルをどの程度反映しているかという問題に、必要な適切性チェックを行う必要があります。 方程式が理論的に導出された場合、結果が受け入れられるかどうかを判断するためにいくつかの点で計算が行われることがあります。 方程式の追加チェックは次元解析で構成されます。 すべての測定単位が物理的な意味に従って使用されていること、および方程式内の寸法のスケーリングと調整が正しく行われていることを確認する必要があります。 さらに、モデル係数が限界値をとる条件で結果をチェックすることが必須です。
概念モデルから数学モデルに移行する場合、現象の記述を形式化するために線形化、近似、補間が使用されますが、それぞれの方法で特定の誤差が生じます。 方程式が実験データの分析から導出された場合、実験データとの一致をランダムにチェックする必要があります。 この場合、統計サンプルを使用して、平均値と分散、分散、回帰、因子およびスペクトル分析、自己相関、「-2乗」基準を使用した検定法、およびノンパラメトリック検定を推定できます。 これらの統計手法はそれぞれ特定の仮定に基づいているため、それらを使用すると、その適切性の評価に関連する疑問が生じます。
概念的モデルに対する数学的モデルの妥当性に関する決定も顧客のみが行うため、研究者はコンピュータ上で数学的モデルを実装する段階に進むことができます。
数学的モデルの精度の評価は、モデリング理論において最も研究されていない方法論的問題の 1 つです。 たとえば、部品の製造における誤差を測定することを考えてみましょう。 x が図面上の部品のサイズ (理想的なサイズ)、x Ф が製造された部品の実際のサイズである場合、絶対製造誤差は次の式で計算されます。
. (4.7)
誤差は部品の製造後に判明する可能性があることに注意してください。
顧客は、モデルから得られた推奨事項を実装することによってシミュレーション結果が実際に得られるものとどの程度異なるかに興味があります。 この場合、そのモデル誤差は (4.7) に似た式によって特徴付けられます。
, (4.8)
どこ ×F– モデルの推奨事項を実装した後に本番環境で得られる実際の結果。 ×M– 「理論的な」結果、つまり 数学モデルを使用した計算から得られます。
ただし、見積り(4.8)はお客様のみが入手可能です 後 モデルの推奨事項がどのように実装されるか。 モデルが間違っていたり、誤差が大きかったりした場合はどうすればよいでしょうか? 当然、お客様が望むのは、 に モデルから得られた推奨事項の実装では、それらが信頼できるものであること、モデルが許容できるエラーによって特徴づけられていることを確認してください。 価値を決める に シミュレーション結果の実装。
しかしその後 、 どこ ×そして- 結果。 「理想的な」数学モデルを使用して取得されます。 エラーのないモデル。 研究中のプロセスの適切な概念的な顧客承認の数学モデルは、コンピュータに実装する前に「理想的な」数学モデルとして受け入れられます。
通常、コンピューター上での数学モデルの実装の精度は、さまざまな種類の誤差のセットを通じて考慮されます。
コンピューター上での「理想的な」モデルの実装におけるエラーを、その発生理由の観点から分類すると (最も一般的なケースとして、統計シミュレーション モデリングを考えてみましょう)、次の 4 つのタイプを区別できます。
1) 無知または不正確な仕様に起因するモデリングエラー 元のデータが与えられます;
2) 元の数学モデルを単純化するときに発生するモデリングエラー。
3) 丸め誤差を含む、使用されるデジタル コンピュータ上の数学モデルの個別実装による出力特性の計算誤差。
4) 統計情報の選択的処理中の限られた統計、またはコンピューター上のモデルの限られた数のランダム テスト (シミュレーション) によって引き起こされるモデリング エラー。
原則として、モデリング誤差は、系統的 (非ランダム) 誤差とランダム誤差の合計です。 エラーの個々のグループを考えてみましょう。
彼らは、モデルとの相対的な分散が経験の分散を大幅に超えるという仮説を、これらの分散間の差異はわずかであるという仮説に対して検証します。 差が有意でない場合 (ある程度の有意レベル、通常は 5%)、モデルの適切性に関する仮説は次のとおりです。
係数の重要性の評価。 モデルの適切性の評価は、さらなる決定を行うための基礎として機能しますが、係数の重要性の評価も常に行われます。 モデルを解釈するときやさらなるスクリーニングのために重要です
モデルの適切性を評価します。 実験誤差を考慮すると、線形モデルが適切かどうかを判断できます。 適切性を確認するために、Fisher の F 検定が構築されます。
係数の重要性の評価。 モデルの適切性の評価は、さらなる決定を行うための基礎として機能しますが、係数の重要性の評価も常に行われます。
フルスケールテスト中にシステムの応答値を決定できる場合、研究対象に対するモデルの適切性の定量的評価が実行されます。
実際のシステムの応答を測定する可能性がない場合、モデルの適切性は、当該職員が公務を遂行する際に、このモデルを使用して得られた結果を使用する可能性についての主観的な判断に基づいて評価されます(特に、決定を正当化する場合)。 実際、この場合、パラグラフ 1.3.4 ですでに述べたように、モデルの適切性をチェックするための非公式な手順は、モデリング結果に対する意思決定者の信頼度を高め、その結果を使用したいという意欲を高めることを目的としています。
モデルの適切性の評価
モデルの有効性をテストするようなプロセスはありません。 代わりに、実験者はモデル開発中に一連のテストを実行して、モデルの信頼性を確立する必要があります。 モデルの適切性の評価は、モデルへの参照に基づいて得られた実際のシステムに関する結論の正しさを判断できる信頼度を許容可能なレベルまで高めることで構成されます。
したがって、モデルの適切性を評価するという問題には 2 つの側面があります。
超過数によるモデルの適切性の評価
統計的特性に従って結果のモデルを評価すると、モデルに含まれる要因の変動により、研究対象のサブシステムのコストの変動が 85% であり、重相関係数が高く (f = 0.92)、有意であることがわかります ( f = 39.8)、モデルは適切であり、平均近似誤差 (е = 5.7%) は 10% 未満です。
ベクトル自己回帰モデルのもう 1 つの欠点は、分散ラグを持つモデルのパラメーターを推定する場合、上に示した通常の OLS がほとんどの場合適用できないため、ラグのサイズ、つまりモデル パラメーターを推定するための適切な方法を決定する必要があることです。 、さらには自己回帰モデルのパラメータの推定には適用できません。 したがって、VAR モデルのパラメータを推定する方法は非常に煩雑であり、現在、すべての統計ソフトウェア パッケージにこの機能が搭載されているわけではありません。 ただし、一般に、VAR モデルは構造モデルよりもはるかに単純である可能性があります。
この場合、適切なリスク評価モデルを構築するには
コンピューター上でのシステムのシミュレーションは、現在、複雑なシステムの特性を評価するための最も普遍的で効果的な方法です。 この作業で最も重要かつ形式化されていない点は、システム 5 と外部環境 E の間の境界を描き、システムの説明を単純化し、最初にシステムの概念モデルを構築し、次に形式的なモデルを構築することです。 モデルは適切でなければなりません。そうでないと、肯定的なモデリング結果を得ることができません。不適切なモデルでプロセスを研究することは一般に意味を失うからです。 適切なモデルとは、モデル開発者によるモデル化されたシステム S の理解レベルである程度の近似を行い、外部環境 E におけるシステムの機能プロセスを反映するモデルを意味します。
適切性の評価の問題は伝統的に考慮されており、関連性があり、複雑であり、解決には程遠いものです。 数学的モデルとアルゴリズムの適切性を評価するには 2 つの方法があります。
数学的モデルとアルゴリズムの適切性を評価するための計算実験は、適切性のレベルの最も正確または許容可能な評価を提供することに焦点を当てた計画を意味し、その適切性を検討するコストを最小限に抑えるか、事前に設定されたかかるコストのレベルを超えないことを条件とします。 。
したがって、数学的モデルまたはアルゴリズムの適切性を評価する実験は、ベクトル応答と因子の混合性質 (定量的なものもあれば定性的なものもある) を使用した実験を計画するものと解釈できます。 したがって、実験を計画する従来の方法を使用し、非公式な調整によって補完することは正当です。
上記を考慮して、コンポーネント E を検査する結果のモデルの適切性の評価を開始できます。 妥当性評価は、シリーズ E に関する 3 つの条件を検討することによって行われます。 これらは、コンポーネント E のランダム性、正規性、および独立性の条件です。
パラメトリック回帰モデルを研究する場合、モデルの妥当性に関する最適化された (回帰パラメータの未知の値の推定値を見つけるための) 基準の最も一般的なタイプは、重み付き (または一般化された) 最小二乗基準です ((9.1)、(9.2) を参照) )。 最適化問題を解決するための計算アルゴリズムを構築するよう努めるべきです。
この段階で、どの変数がランダムで、どの変数が決定的であるかが決定されます。 モデルの構造を決定した後、そのパラメータの値が評価され、その前に必要な初期情報を収集する段階が行われます。 このステージ必ず、オブジェクトに対するモデルの適切性をチェックして終了する必要があります。 適切性をチェックするための一般的な方法論はありません。 多くの質問に対して肯定的な回答が得られた場合、モデルは研究の目的に適切であるとみなされます。
したがって、そのようなモデルに関する科学的妥当性と正確さに関する質問に答える必要はありません。 2 番目のクラスのモデルは、それほど厳密かつ形式的に正当化されていないモデルですが、意思決定者は、モデルに基づいてモデル化した結果を実際に使用することの有用性を確信する機会を何度も経験しています。 いずれにせよ、モデルが適切かどうかという質問には実践するしか答えられないことは明らかです。 したがって、運用後に得られた実際の有効性の評価 (1.1.3 項を参照) で、モデリング結果の使用が有用であることが判明した場合は、意思決定者がそのようなモデルが組織の目標と目的に適切であると考慮することをお勧めします。モデリングが不要になり、「理論的な妥当性と正確さ」の問題に悩まされる必要がなくなります。 モデリング結果に基づいて情報を提示する際の問題にもっと注意を払う方がよいでしょう。 この作業では、専門文献で概説されている効果的なテクノロジーやテクニックを学ぶことが非常に役立ちます。
この目的のために、3 種類のチェックを使用できます。 最初のタイプをチェックするときは、モデルが単純に不合理な答えを与えるかどうかをチェックする必要があります。 モデルの適切性を評価する 2 番目の方法は検証と呼ばれます。 シミュレーション モデルの検証では、その動作が実験者の仮定に準拠しているかどうかを確認します。 これは、実際のシミュレーション実験の準備の最初の段階です。 計算結果を提示できるいくつかの初期データが選択されます。 モデル作成時に予想されたものと矛盾するデータをコンピューターが生成したことが判明した場合、そのモデルは間違っています。 それ以外の場合は、モデルの機能をチェックする次の段階である検証に進みます。
履歴データに対するテスト (バフェテスト) によるモデルの適切性の定期的な評価が最も効果的です。 既知の方法 VaR モデルの検証。G10 諸国による内部モデルに基づくアプローチの採用により、このモデルは正式な地位を獲得しました。 標準的な方法バーゼル委員会は、VaR モードを使用して留保資本額を計算する銀行は、毎日の予測 VaR 値と実際の資本金の値の変化との比較に基づいて、過去のデータを使用してモデルの適切性を評価する四半期ごとのテストを実施する必要があると規定しています。過去 2i 日間の取引における毎日のポートフォリオ。 VaR値を超える損失の数に応じて、監督当局は自己資本比率の要件を引き上げることができますが、これは実際にはリスクを過小評価するモデルの調整の一種です。A二乗法やA二乗法など、より複雑な検証方法もあります。コルモゴロフ・スミルノフ合意基準(通常法に準拠しているかどうかの実質収益分布のチェック)、クーパー基準、VaR値を超える損失のケースの独立性のテストなど。
重要な要素分析はモデルの適切性を評価することです。 これを行うには、Fisher-Snedecor 基準 (F) を分析する必要があります。これは、図 3.8 のダイアログ ボックスにも表示されます。 この例では、F(5,24) = 117.36 です。 計算された FP の値は、表にまとめられた値と比較する必要があります。この値は、与えられた自由度 5 v = 5 および V2 = 24 の場合、FT = 2.62 に等しくなります。
同時に、マネージャーのパフォーマンスを評価するための適切なモデルを構築することが特に重要です。 管理者の評価は次の 4 つの原則に基づいて行われるべきです2
2番目の方法。 原理的には、提案された手順のバリエーションが可能です。これは、示されている手順よりも頻繁に使用されませんが、科学研究を行う場合にも非常に一般的です。 私たちは、実際のオブジェクトを認定された参照モデルに置き換える、重要な種類の検証実験について話しています。 一般に、このようなアッセイ モデルは、妥当性についてテストされるモデルよりも詳細であり、より広範な有効なオプションのセットに適用できます。 検討中の方法の利点は明らかです。実際の対象物を検査することを拒否することにより、適切性を評価するための時間を含むコストが削減され、比較にならないほど広範囲の状況に対するより代表的なテストが可能になります。 欠点も非常にはっきりと目に見えています。理想的なモデルに固有の追加誤差の導入、本格的なモデルの必要性などです。
~についての作業仮説 全体像適切な数学的統計基準を使用して、目的の回帰関数をチェックできます。 これらの統計的基準の基礎となる基本的な考え方の中で、a) 分布を正規法則に近づけるために変数を変換するための回帰モデルの複雑さの間の妥協点についての考え方を強調する必要があります。 より適切な詰まりのモデルは、体積が増加する一連のサンプルの図であり、n が増加するにつれて詰まりの割合 q= yn 1/2 が減少します。 7.2.4. Ev 回帰 (i 回帰)。 以下、e-estimate導入時と同じ方法で、。 一連の定義を使用して、e 回帰とそこからの偏差を示す特別な尺度が導入されます。 さらに、e 回帰には、通常の最小二乗回帰の特性に似た多くの特性があることが示されています。 これにより、e 回帰の有意義な解釈と、特定のケースに適した値 R の選択が容易になります。結論として、e 回帰のパラメータを推定するための漸近展開が得られます。
パラメータ名 | 意味 |
記事のトピック: | MI の適切性の評価 |
ルーブリック(テーマ別) | テクノロジー |
MI の場合、モデルの動作中に得られた結論を研究対象の制御システムに転送する可能性を正当化するという問題は避けられません。MI の適切性とは、モデルのパラメータがモデルの特性をどの程度反映しているかを意味します。特定の研究に必要な精度を備えた研究中のシステム。
適切性評価は、次の 2 つの関連プロセスに分かれます。
A. 検証 – ᴛ.ᴇ。 研究中のシステムの概念モデルの同一性を確認する。
B. モデルの適合性 - シミュレーション結果を IS に転送する機能。
検証は一般に受け入れられている手順であり、ほとんどの場合避けられません。
MI における適合性評価はかなり物議を醸しており、実用新案の信頼性を損なう可能性があるとさえ考えられています。 同時に、適合性評価は複数の基準を伴うプロセスであるため、非常に複雑であり、そのような評価のための単一の基準システムはありません。
検証と適合性を評価する方法は、次の 2 つのグループに分類されます。
形式的(統計的)手法
ユーザーと意思決定者が関与する非公式。
A. 検証には、予防手順とデバッグ手順が含まれます。 予防措置には次のようなものがあります。
· 入力データ、入力制御などの適合性をチェックする。
· 3 つのセクションの形式でプログラムを構築します。
モデル構造、
厳密なステートメントのシーケンスを使用してプログラムを実行する。
BSV センサーをチェックしています。
· 計算の精度 (データ形式、丸め、切り捨て) をチェックします。
デバッグは、前の段階でのエラー、それらが繰り返される可能性を分析し、プログラム ロジックを調査することから始まります。 場合によっては、機械プログラムを作成した後で概念モデルの構築を再試行すると便利です。 デバッグ手順には、構文とセマンティクスの調整、モデルの感度の分析も含まれます。 デバッグはプログラムのセクションごとに実行されます。
B 適合性評価
多数の論文の分析により、適合性を評価するための基準の分類を提示することが可能になりました (表 3.6)。
表3.6
MI 適合性の種類 | 適合性評価 | 適合性解析の条件 |
テクニカル | 理論的 | 数学的実質的および因果的仮定の説明 |
データの適合性 | 未加工 | データの正確性、公平性、代表性の評価 |
構造化された | 位置比較演算の精度を考慮する | |
構造的 | ISの内部関係を正しく反映 | |
予報 | 未来を予測する能力 | |
手術室 | レプリカティブ | IC特性再現精度 |
堅牢性 | モデルの感度を考慮して | |
実装 | 実用化の可能性 | |
動的 | モデルの更新と正常な使用 |
A) 技術的適合性は、モデルの基礎となる理論的前提の妥当性を決定する必要があります。 まず、行われたすべての仮定が評価され、次にデータの適合性が評価されます。 特定された不一致はモデルの「ボトルネック」を指しており、軽減する必要があります。
B) 運用上の適合性は、技術的な適合性ほど明確ではなく、より大きな不一致が許容されます。 入力パラメータの極値を設定するときの MI プロセスのエラーに対する感度分析を含む、堅牢性には特に注意が払われています。 複製適合性では、IC 特性の再現における忠実度のレベルを評価する必要があります。 形式的には、2 つのサンプルを用意し、統計的手法 (回帰分析と因子分析、x 2 テストと F テスト、チューリング テスト) を使用してそれらを評価することが非常に重要です。
B) ダイナミックフィットネス。 運用上の適合性に影響を与える時間範囲の不一致は、IM の動的な適合性、およびデータの更新および拡張の可能性によって評価されます。
その結果、IM アルゴリズムのブロック図には、実行される作業のシーケンスを示す多数のアクションが含まれます。
図 3.16 はアルゴリズムのフローチャートの一部を示しており、検証と適合性の評価が相互に関連していることがわかります。
抽象的なシステムまたはシステムがあるため、 アクセスできない情報、その後、意思決定方法がよく使用されますが、これについては以下で説明します (第 5 章を参照)。
図 16 アルゴリズムのブロック図の一部
IM の適切性の評価 - 概念と種類。 「MIの適切性の評価」カテゴリーの分類と特徴2017年、2018年。
数学的モデル構築の段階
最初のステージ数学的モデリングは 問題の記述、研究の目的と目標の定義、オブジェクトを研究するための基準(標識)を設定し、それらを管理します。 問題の定式化が不正確または不完全であると、後続のすべての段階の結果が無効になる可能性があります。 図 3 は、 一般的なスキーム数学的モデルの構築。
米。 数学モデル構築の 3 つの段階
第二段階モデリングは 数学的モデルのタイプの選択とは何ですか 最も重要な瞬間、研究全体の方向性を決定します。 通常、複数のモデルが順番に構築されます。 彼らの研究結果を現実と比較することで、最良の結果を決定することができます。 数学的モデルの種類を選択する段階では、探索実験から得られたデータの分析を使用して、線形性または非線形性、動的または静的性、定常性または非定常性、およびオブジェクトまたはプロセスの決定性の程度が確立されます。研究中です。
オブジェクトの数学的モデルを選択するプロセスはこれで終了します 予備制御、これはモデルを探索するための最初のステップでもあります。 この場合、次の種類の制御 (チェック) が実行されます。 命令。 依存関係の性質。 極端な状況。 境界条件; 数学的分離。 物理的な意味; モデルの安定性。
たとえば、コントロール 寸法同じディメンションの値のみを同等にして加算することができます。 桁違いの数量によりモデリングが簡素化されます。 追加された量の次数が決定され、明らかに重要でない項は破棄されます。 モデルの安定性これは、実際のオブジェクトに関する利用可能なデータの枠組み内で初期データを変更しても、ソリューションに大きな変化が生じないことを確認することから構成されます。
適切性- モデルが記述のために構築された実際の現象またはオブジェクトに対するモデルの対応度。 どのモデルも、オブジェクトまたはシステムの機能プロセスのおおよその説明を提供します。 したがって、それは必要です 特別な手続き構築されたモデルの信頼性(適切性)の証拠。 このような評価は、数理統計の手法を使用して行われます。
このモデリング手法の最も重要な欠点は、提案されたモデルの妥当性を証明することが難しいことです。
開発されたモデルの適切性の評価は現実的です 既存のシステム実際のシステムでの測定結果とモデルでの実験結果を比較することで作成され、実行できます。 さまざまな方法で。 最も一般的なものは次のとおりです。
– モデルとシステムの平均応答値に基づきます。
– システム応答の平均値からのモデル応答の偏差の分散による。
- による 最大値システム応答からのモデル応答の相対偏差。
実際、指定された評価方法は互いに非常に近いため、最初の評価方法のみを検討します。 この方法では、観測変数の平均値が実際のシステムの平均応答値に近いという仮説を検証します。
実際のシステムでの実験の結果、一連の値(サンプル)が得られます。 モデルに対して実験を実行することにより、観測変数の多くの値も取得されます。
次に、モデルとシステム応答の数学的期待値と分散の推定値が計算され、その後、(統計的な意味での)量と平均値の近さについての仮説が立てられます。 仮説を検証するための基礎は統計 (生徒の分布) です。 テスト結果から計算されたその値は、 クリティカル値、ルックアップテーブルから取得されます。 不等式が満たされる場合、仮説は受け入れられます。
ただし、統計的手法は、既存のシステムに対するモデルの適切性が評価される場合にのみ適用されます。 当然のことながら、設計されたシステムで測定を実行することはできません。 この場合、設計されたシステムの概念モデルが参照オブジェクトとして取られ、ソフトウェア実装モデルの適切性の評価は、それが概念モデルをどの程度正確に反映しているかをチェックすることで構成されます。
既存のシステムと設計されたシステムの両方のモデルの適切性をチェックする場合、実際に使用できるのは、入力パラメーター (ワークロードと外部環境) のすべての可能な値の限られたサブセットのみです。 この点において、得られたモデリング結果の信頼性を実証するには、モデルの安定性をチェックすることが非常に重要です。
モデルの安定性- これは、ワークロードの可能な範囲全体にわたってシステムの効率を調査するとき、およびシステム構成に変更を加えるときに、適切性を維持する能力です。
モデルの構造がシステムの構造に近ければ近いほど、詳細度が高くなるほど、モデルはより安定します。 モデリング結果の安定性は、数学的統計の方法によっても評価できます。