minnanods

全般

データサイエンスのプロセス

CRISP-DMデータサイエンスのプロセス(ワークフロー)としてとりわけ有名なものに、CRISP-DMがあります。CRISP-DMは"CRoss-Industry Standard Process for Data Mining"の略で、直...
全般

CRISP-DM

CRISP-DMとはCRISP-DMは"CRoss-Industry Standard Process for Data Mining"の略で、直訳すると「データマイニングのための業界横断型標準プロセス」です。データマイニングはデータサイエ...
全般

「分析」と「解析」の違い?

「分析」と「解析」の違いを、このように説明する向きがあるようです。「分析」とは、構成要素を明らかにし、問題点を絞り込むこと。「解析」とは、その問題点をさらに細かく調べ、真の原因を追究すること。つまり「分析」してから、「解析」するという流れが...
全般

データサイエンスのツール

データサイエンスのツールとは「データサイエンスのツール」といった場合、大きくはデータ管理に関するツール、データ分析に関するツール、そしてアプリケーション開発に関するツールに分けることができますここではツールという言葉を、ソフトウェアおよび言...
Python・R

R と Python

R と Pythonの比較データ分析のツールとして代表的な存在である、R と Python を比較します。どちらも、無償のオープンソースプログラミング言語である点は共通しています。R が統計解析用のプログラミング言語としてはじめから開発され...
全般

統計解析と機械学習

本サイトでは様々なテーマを、「統計解析と機械学習の違い」という切り口で説明しています。しかし何が統計解析であり、何が機械学習であるというのは、じつのところ明確な答えのあるものではありません。あくまで「本サイトではこのように考えている」という...
全般

データサイエンティスト

データサイエンティストとはハーバード・ビジネス・レビューの2012年10月号において、「データサイエンティスト:21世紀でもっとも魅力的な職業(Data Scientist: The Sexiest Job of the 21st Cent...
全般

データサイエンス

データサイエンスとはデータサイエンス(Data Science)とは何でしょうか?『デジタル大辞泉』(小学館)には、次のようにあります。データの分析についての学問分野。統計学、数学、計算機科学などと関連し、主に大量のデータから、何らかの意味...