minnanods

数学・統計学

関数

関数とは関数(function)とは、ある入力に対して一定の規則で出力を返す仕組みのことを指します。AI(人工知能)のモデルも関数の一種と考えることができます。\( x \) を入力変数、\( y \) を出力変数とする関数 \( f(x)...
全般

データサイエンティスト検定

データサイエンティスト検定とは「データサイエンティスト検定 リテラシーレベル」は、一般社団法人データサイエンティスト協会が主催している検定です。2021年9月に、第1回試験が開催されました。データサイエンティスト協会では、データサイエンティ...
全般

半構造化データ(XML/JSON)

半構造化データとは半構造化データ(Semi-structured Data)とは、名前の通り構造化データと非構造化データの中間的な性質を持つデータです。そのままではRDBで扱うことができないため、一般的には半構造化データは非構造化データの一...
統計解析・応用統計

質的変数・量的変数と尺度水準

質的変数・量的変数と尺度水準統計解析において、変数は大きく質的変数(qualitative variable)と量的変数(quantitative variable)に分類されます。ここでいう変数(variable)は、変量(variate...
統計解析・応用統計

変量(統計解析における変数)

統計解析における変数統計解析において、変数(variable)を変量(variate)と呼ぶ場合があります。変数と変量の違いを、明確に説明することは困難です「確率分布を考えたものが、変量である」という説明がされることもありますが、必ずしもす...
全般

プログラミングにおける変数

変数とは数学(代数学)において、変数(variable)とは数字を文字で代用したものです。文字には様々な数字を入れることができるため、「変化する数」という意味でそう呼ばれています。ちなみに、ある変数とある変数の関係を表すものを関数(func...
全般

Irisデータセット

IrisデータセットとはIrisデータセットは、データサイエンスの世界でもっとも有名なデータセットのひとつです。統計学に多大な功績を残したロナルド・エイルマー・フィッシャー(Ronald Aylmer Fisher)が論文で使用したデータセ...
全般

データの種類(良いデータの条件)

データの種類様々な観点から、データを種類分けすることができます。ここでは、構造化データと非構造化データ、時系列データと非時系列データ、実験データと観察データ、ビッグデータとスモールデータについて投稿した記事をまとめています。構造化データと非...
全般

ワイドデータとロングデータ

ワイドデータとロングデータワイドデータ(wide data)とロングデータ(long data)ワイド型(式)とロング型(式)という場合もあります。またロングを、「狭い」という意味でナロー(narrow)と表現する場合もあります。は、データ...
全般

ビッグデータとスモールデータ

ビッグデータとはビッグデータ(Big Data)とは何でしょうか?この回答は、構造化データと非構造化データ、時系列データと非時系列データ、あるいは実験データと観察データについて語るより、ずっと困難です。ビッグデータというのは、一種のバズワー...