データサイエンス全般 半構造化データ(XML/JSON) 半構造化データとは 半構造化データ(Semi-structured Data)とは、名前の通り構造化データと非構造化データの中間的な性質を持つデータです。 そのままではRDBで扱うことができないため、一般的には半構造化デ... 2022.03.26 データサイエンス全般
統計解析 質的変数・量的変数と尺度水準 質的変数・量的変数と尺度水準 統計解析において、変数は大きく質的変数(qualitative variable)と量的変数(quantitative variable)に分類されます。ここでいう変数(variable)は、変量(var... 2021.09.14 統計解析
統計解析 変量(統計解析における変数) 統計解析における変数 統計解析において、変数(variable)を変量(variate)と呼ぶ場合があります。 変数と変量の違いを、明確に説明することは困難です「確率分布を考えたものが、変量である」という説明がされることもありま... 2021.06.11 統計解析
データサイエンス全般 プログラミングにおける変数 変数とは 数学(代数学)において、変数(variable)とは数字を文字で代用したものです。 文字には様々な数字を入れることができるため、「変化する数」という意味でそう呼ばれています。 ちなみに、ある変数とある変数の関係を... 2021.06.10 データサイエンス全般
データサイエンス全般 Irisデータセット Irisデータセットとは Irisデータセットは、データサイエンスの世界でもっとも有名なデータセットのひとつです。 統計学に多大な功績を残したロナルド・エイルマー・フィッシャー(Ronald Aylmer Fisher)が論文で... 2021.05.21 データサイエンス全般
データサイエンス全般 データの種類(良いデータの条件) データの種類 様々な観点から、データを種類分けすることができます。 ここでは、構造化データと非構造化データ、時系列データと非時系列データ、実験データと観察データ、ビッグデータとスモールデータについて投稿した記事をまとめています。... 2021.05.15 データサイエンス全般
データサイエンス全般 ワイドデータとロングデータ ワイドデータとロングデータ ワイドデータ(wide data)とロングデータ(long data)ワイド型(式)とロング型(式)という場合もあります。またロングを、「狭い」という意味でナロー(narrow)と表現する場合もあります。は... 2021.05.09 データサイエンス全般
データサイエンス全般 ビッグデータとスモールデータ ビッグデータとは ビッグデータ(Big Data)とは何でしょうか? この回答は、構造化データと非構造化データ、時系列データと非時系列データ、あるいは実験データと観察データについて語るより、ずっと困難です。 ビッグデータと... 2021.05.08 データサイエンス全般
データサイエンス全般 実験データと観察データ 実験データとは 次のように実験計画に基づき取得されたデータのことをいいます。本例は、JMPのサンプルデータCustom RSM.jmpより。 X1 X2 X3 Y -1 -1 -1 57.42 ... 2021.05.03 データサイエンス全般
データサイエンス全般 時系列データと非時系列データ 時系列データとは 時系列データ(Time Series Data)とは、下表のtime列のように、時系列に関する情報が含まれたデータのことをいいます。本例は、Rのvarsパッケージに含まれるCanadaデータセットより。 時系列... 2021.05.02 データサイエンス全般