minnanods

統計解析・応用統計

質的変数・量的変数と尺度水準

質的変数・量的変数と尺度水準統計解析において、変数は大きく質的変数(qualitative variable)と量的変数(quantitative variable)に分類されます。ここでいう変数(variable)は、変量(variate...
統計解析・応用統計

変量(統計解析における変数)

統計解析における変数統計解析において、変数(variable)を変量(variate)と呼ぶ場合があります。変数と変量の違いを、明確に説明することは困難です「確率分布を考えたものが、変量である」という説明がされることもありますが、必ずしもす...
全般

プログラミングにおける変数

変数とは数学(代数学)において、変数(variable)とは数字を文字で代用したものです。文字には様々な数字を入れることができるため、「変化する数」という意味でそう呼ばれています。ちなみに、ある変数とある変数の関係を表すものを関数(func...
全般

Irisデータセット

IrisデータセットとはIrisデータセットは、データサイエンスの世界でもっとも有名なデータセットのひとつです。統計学に多大な功績を残したロナルド・エイルマー・フィッシャー(Ronald Aylmer Fisher)が論文で使用したデータセ...
全般

データの種類(良いデータの条件)

データの種類様々な観点から、データを種類分けすることができます。ここでは、構造化データと非構造化データ、時系列データと非時系列データ、実験データと観察データ、ビッグデータとスモールデータについて投稿した記事をまとめています。構造化データと非...
全般

ワイドデータとロングデータ

ワイドデータとロングデータワイドデータ(wide data)とロングデータ(long data)ワイド型(式)とロング型(式)という場合もあります。またロングを、「狭い」という意味でナロー(narrow)と表現する場合もあります。は、データ...
全般

ビッグデータとスモールデータ

ビッグデータとはビッグデータ(Big Data)とは何でしょうか?この回答は、構造化データと非構造化データ、時系列データと非時系列データ、あるいは実験データと観察データについて語るより、ずっと困難です。ビッグデータというのは、一種のバズワー...
全般

実験データと観察データ

実験データとは次のように実験計画に基づき取得されたデータのことをいいます。本例は、JMPのサンプルデータCustom RSM.jmpより。X1X2X3Y-1-1-157.4200055.070-1057.65-10058.411-172.8...
全般

時系列データと非時系列データ

時系列データとは時系列データ(Time Series Data)とは、下表のtime列のように、時系列に関する情報が含まれたデータのことをいいます。本例は、Rのvarsパッケージに含まれるCanadaデータセットより。時系列データには、本例...
全般

構造化データと非構造化データ

構造化データとは構造化データ(Structured Data)とは、次のような表形式で初めから与えられているデータのことをいいます。本例は、Rにプリセットされているirisデータセットより。Sepal.Length、Sepal.Width、...