データサイエンス全般 構造化データと非構造化データ 構造化データとは 構造化データ(Structured Data)とは、次のような表形式で初めから与えられているデータのことをいいます。本例は、Rにプリセットされているirisデータセットより。 Sepal.Length、Sepa... 2021.05.01 データサイエンス全般
データサイエンス全般 「分析」と「解析」の違い? 「分析」と「解析」の違いを、このように説明する向きがあるようです。 「分析」とは、構成要素を明らかにし、問題点を絞り込むこと。 「解析」とは、その問題点をさらに細かく調べ、真の原因を追究すること。 つまり「分析」してから、「解... 2021.03.21 データサイエンス全般
データサイエンス全般 データサイエンスのツール データサイエンスのツールとは 「データサイエンスのツール」といった場合、大きくはデータ管理に関するツール、データ分析に関するツール、そしてアプリケーション開発に関するツールに分けることができますここではツールという言葉を、ソフトウェア... 2021.03.14 データサイエンス全般
データサイエンス全般 RとPython RとPythonの比較 データ分析のツールとして代表的な存在である、RとPythonを比較します。どちらも、無償のオープンソースプログラミング言語である点は共通しています。 Rが統計解析用のプログラミング言語としてはじめから開発... 2021.03.07 データサイエンス全般
データサイエンス全般 統計解析と機械学習 本サイトでは様々なテーマを、「統計解析と機械学習の違い」という切り口で説明しています。しかし何が統計解析であり、何が機械学習であるというのは、じつのところ明確な答えのあるものではありません。あくまで「本サイトではこのように考えている」という... 2021.02.26 データサイエンス全般