データ分析ツールパッケージには、統計データ分析、乱数生成、データサンプリングのさまざまなツールが含まれています。これらのツールを使うには、``Tools''メニューの中の``Data Analisis...''を選びます。すると選択できるツールのリストが開きます。そのリストから一つを選んで、OKボタンを押してください。ツールは以下で紹介します。
全てのツールには共通な出力オプションがあります。分析結果は、新しいシート、新しいワークブック、分析データの入っている同じシートに出力することができます。出力方法を選択するには、``Output options:''ラベルの下のラジオボタンの中の一つを選ぶだけです。出力範囲が小さすぎると、解析結果が収まりきれない場合があることに注意してください。出力範囲に入っていた古いデータが消えてしまうことにも注意してください。
このツールを使えば、指定された変数の分散の一因子分析ができます。変数は``Input Range:'' エントリで指定します。範囲には行でも列でも指定できます。``Alpha:'' エントリには、有意水準を指定します。デフォルトでは 95 %が指定されています。
例えば第 1 行に変数名のようなラベルがついている場合には、``Labels''ボタンをチェックしてください。第 1 行(列でグループ化されている場合には第 1 列)が、分析の対象からはずされます。さらに出力範囲に変数名が貼り付けられます。
このツールは、グループ間、グループ内、全体を元に変動を計算します。これらの値は、''SS'' 列に表示されます。.自由度は、"df" 列に表示されます。''MS'' 列には、変動を自由度で割った値が表示されます。 商は、''F'' 列での F- 値の計算に用いられます。 F- 値は、''Between columns''の''MS''と''Within columns''の''MS''の比です。 この値と、最終列の''F critical''値 ( F- 境界値 ) を比較します。 ''F critical''値は、有意水準''Alpha''を使った際に統計的に有意であるFの最大値です。下の''P-value'' は F- 検定の結果です。
さらに、このツールは、要素数、合計、平均、分散を計算します。
相関分析ツールは、指定された変数の相関係数を計算します。このツールを使えば、同時にいくつもの相関係数が計算できます。相関分析の対象となる変数は、``Input Range:''エントリで指定します。指定された範囲は、行か列でグループ化されます。
例えば、列 A と列 B の 2 変数の相関を計算するとします。両変数とも 1 行目から 10 行目までの 10 個の値を持つとします。はじめに、``Input Range:''エントリに A1:B10 を指定します。次に、``Groupped By:''ラベルに続く``Columns''ラジオボタンを選択します。そして出力オプションを指定し、OK ボタンを押します。
第 1 行に変数名のようなラベルがついている場合には、``Labels''ボタンをチェックしてください。 第 1 行(列でグループ化されている場合には第 1 列)が、分析の対象からはずされます。さらに出力範囲に変数名が貼り付けられます。
結果は、各行・列に対応する変数名でラベルをつけられたテーブルに出力されます。出力範囲に名前がない場合、Gnumeric が作成します。算出された相関係数は、表形式で与えられます。例えば、前出の例、つまり列 A と列 B の変数の相関については、結果テーブルの 2 列目の 3 行目から読み取れます。(``Column 1''とラベルがつけられた列の、``Column 2''とラベルが付けられた行の中にあります。)
共分散ツールは、指定された変数の共分散を計算します。このツールを使うと、同時にいくつもの共分散が計算できます。共分散を計算する変数は、``Input Range:'' エントリで指定します。指定された範囲は行か列でグループ化されます。
例えば、列 A と列 B の2変数の共分散を計算したいとします。両変数とも 1 行目から 10 行目までの 10 個の値を持っているとします。はじめに、``Input Range:''エントリに A1:B10 を指定します。次に、``Groupped By:''ラベルの次にある、``Columns''ラジオボタンを選びます。それから、出力オプションを指定し、OK ボタンを押します。
第 1 行に変数名のようなラベルがついている場合には、``Labels''ボタンをチェックしてください。 第 1 行(列でグループ化されている場合には第 1 列)が、分析の対象からはずされます。さらに出力範囲に変数名が貼り付けられます。
結果は、各行・列に対応する変数名でラベルをつけられたテーブルに出力されます。出力範囲に名前がない場合、Gnumeric が作成します。算出された共分散は、表形式で与えられます。例えば、前出の例、つまり列 A と列 B の変数の共分散は、結果テーブルの 2 列目の 3 行目から読み取れます。(``Column 1''とラベルがつけられた列の、``Column 2''とラベルが付けられた行の中にあります。)
記述統計ツールは、指定された変数の統計情報を計算します。このツールを使えば、同時にいくつもの変数の一般的な統計量、平均値の信頼水準が計算できます。統計分析の対象となる変数は、``Input Range:''エントリで指定されます。指定された範囲は、行または列でグループ化されます。
このツールは、4 種類の異なる統計データを算出します。``Summary Statistics''ボタンがチェックされていると、基本統計量が計算できます。 平均値, 標準誤差, 中央値(メディアン), 最頻値(モード), 標準偏差, 標本分散, 劣度, 歪度, 範囲, 最小値, 最大値, 合計, カウント数が計算できます。
``Confidence Level for Mean''ボタンがチェックされている場合、各変数の平均の信頼水準を計算します。信頼水準を表すパーセントを指定しなければなりません。デフォルトの信頼水準は 95 %です。
``Kth Largest:'' ボタンがチェックされている場合、k 番目に大きい値を探し出します。チェックボタンの次にあるエントリボックスに k を指定して OK ボタンを押して下さい。
``Kth Smallest:'' ボタンがチェックされている場合、k 番目に小さい値を探し出します。チェックボタンの次にあるエントリボックスに k を指定して OK ボタンを押してください。
例えば第一行に変数名のようなラベルがついている場合には、``Labels'' ボタンをチェックしてください。 第一行(列でグループ化されている場合には第一列)が、分析の対象からはずされます。さらに出力範囲に変数名が貼り付けられます。
F- 検定ツールを使うと、2変数の分散に有意の差があるかどうかを分析できます。第一変数の値は、``Variable 1 Range:''エントリで指定します。同様に、第二変数の値は、``Variable 2 Range:''エントリで与えられます。``Alpha:''エントリには、有意水準を指定します。デフォルトは 95 %です。
出力は範囲で、少なくとも 3 列 8 行になります。
結果は表形式で与えられます。このツールは、平均値、分散、観察数、自由度を計算し出力します。 F- 値, F- 値の片側確率、片側検定のF境界値も計算します。F- 値の片側確率(``P( <= f ) one-tail''行) は、片側検定の第一種の過誤の危険度を表します。
このツールを使うと乱数が生成できます。様々な分布をもつ乱数が生成できます。
このツールを使うには、はじめに``Number of Variables:''エントリボックスに変数の数を指定します。この値により、乱数の列数が決まります。次に、生成する乱数の数を指定します。この値により、乱数の行数が決まります。そして、分布リストから一つ選択して、分布を指定します。 サポートされている分布は、離散分布、正規分布、ベルヌーイ分布、一様分布です。最後に、分布のパラメーターを指定します。
離散分布では、``Value and Probability Input Range:'' エントリボックスで、値と確率の範囲を指定します。 2 つの列と複数の行から構成されています。第 1 列では、離散型乱数値を指定し、第 2 列では、その確率を指定します。 離散型乱数値は、数である必要はなく、例えば文字列も使えます。第 2 列の確率の合計は 1 でなければなりません。例えば、A1:A4 に A, B, C,D があり、それぞれの確率として B1:B4 に、0.1, 0.4, 0.2, 0.3 がある場合、値と確率の範囲として A1:B4 を指定できます。
正規分布では, 平均値と標準偏差を指定します。 デフォルトは、平均値 0 で、標準偏差 1 です。
ベルヌーイ分布では, ``p Value''を指定します。 これは、0 から 1 までの確率値です。 ベルヌーイ分布は 2 値、0 と 1 を持ち, ``p Value''で値1の場合の確率を指定します。ベルヌーイ分布の乱数の平均は、 E(X) = 1(p) + 0(1-p) = pで, 分散は var(X) = p(1-p)です。
一様分布では、``Between:'' と``And:'' エントリを埋めることで乱数の範囲を指定します。デフォルト値は 0 と 1 で、 0 と 1 の間の乱数を指定します。
標本抽出ツールを使えば、データ集合から標本を取り出すことができます。 ランダム(無作為)抽出と、例えばデータ集合の 4 番目の値をとってゆくような、周期抽出ができます。
このツールを使うには、はじめに、``Input Range:''にデータ集合を指定します。それから、周期(periodic)かランダム(random)かの抽出方法を指定します。周期抽出の場合、``Period:''エントリに数字を指定する必要があります。例えば、周期として 3 を指定した場合、元のデータ集合から 3 番目のものを順次抽出します。ランダム抽出の場合、``Number of Samples:''エントリに、サンプル数を指定する必要があります。元のデータ数より大きいサンプル数は指定できません。元のデータ集合の値は最大でも 1 回しか抽出できないからです。
z- 検定ツールを使うと、2変数の平均に有意差があるかどうかを分析できます。第 1 変数の値は、``Variable 1 Range:''エントリで指定します。同様に、第 2 変数の値は、``Variable 2 Range:''エントリで指定します。 また、``Variable 1 Variance (known):'' と``Variable 2 Variance (known):'' エントリで、両変数の偏差を指定しなければなりません。
平均の差が所与の値より大きいかどうか検定するには、``Hypothesized Mean Difference:''(仮説上の平均の差)エントリを指定してください。``Alpha:'' エントリでは、有意水準を指定します。デフォルトは 95 %です。
出力範囲は、最低でも 3 列 10 行になるでしょう。
結果は表形式で与えられます。平均、既知の偏差、両変数の観察数を計算します。また、z- 値、z- 値の片側と両側の確率、片側検定と両側検定の z- 境界値も計算します。z- 値の片側確率 (``P(Z<=z) one-tail'' 列) は、片側検定の第一種の過誤の危険度を表しています。