Looking for machine-learning Answers? Try Ask4KnowledgeBase
Looking for machine-learning Keywords? Try Ask4Keywords

machine-learning機械学習を始める


備考

機械学習とは、コンピュータをプログラミングしてデータから学ぶことができる科学(と芸術)のことです。

より正式な定義:

これは、コンピュータに明示的にプログラムされなくても学習する能力を与える研究の分野です。アーサー・サミュエル、1959

よりエンジニアリング指向の定義:

コンピュータプログラムは、Pによって測定されるT上の性能が経験によって改善される場合、あるタスクTおよびある性能指標Pに関して経験Eから学習すると言われている.E Tom Mitchell、1997

出典:AurélienGéron(O'Reilly)によるScikit-LearnとTensorFlowを使った実践的な機械。 Copyright 2017AurélienGéron、978-1-491-96229-9。

機械学習(ML)は、人工知能の研究から生まれたコンピュータサイエンスの分野です。他の形式の分析よりも機械学習の強さは、隠された洞察を明らかにし、将来の、見えない入力(一般化)の結果を予測する能力にあります。操作が明示的に宣言される反復アルゴリズムとは異なり、機械学習アルゴリズムは、確率論から概念を借用して統計モデルを選択、評価、改善します。

Pythonを使用したインストールまたはセットアップ

1)scikit learn

scikit-learnは、SciPyの上に構築され、3節BSDライセンスの下で配布される機械学習のためのPythonモジュールです。サポートベクトルマシン、ランダムフォレスト、グラジエントブースト、k-means、DBSCANなどのさまざまな分類、回帰、クラスタリングアルゴリズムを備えており、Pythonの数値および科学ライブラリNumPyおよびSciPyと相互運用するように設計されています。

scikit-learnの現在の安定版には次のものが必要です:

  • Python(> = 2.6または> = 3.3)、
  • NumPy(> = 1.6.1)、
  • SciPy(> = 0.9)。

ほとんどのインストールの場合はpip のpythonパッケージマネージャのpythonとその依存関係のすべてをインストールすることができます。

pip install scikit-learn
 

しかし、Linuxシステムの場合、可能なビルドプロセスを回避するためにconda パッケージマネージャを使用することが推奨されています

conda install scikit-learn
 

scikit-learn あることを確認するには、シェルで実行します:

python -c 'import sklearn; print(sklearn.__version__)'
 

WindowsとMac OSXのインストール:

CanopyAnacondaは、Windows用の大規模な科学的Pythonライブラリ、Mac OSX(Linuxにも適している)のほかに、最近のscikit-learnのバージョンを出荷しています。

正式なソースコードレポ: https : //github.com/scikit-learn/scikit-learn


2)インテリジェントコンピューティングのためのNumentaプラットフォーム

Numentaインテリジェントコンピューティングプラットフォーム(NuPIC)は、HTM学習アルゴリズムを実装するマシンインテリジェンスプラットフォームです。 HTMは、新皮質の詳細な計算理論です。 HTMの中核には、空間パターンと時間パターンを保存して呼び出す時間ベースの連続学習アルゴリズムがあります。 NuPICは、ストリーミングデータソースの異常検出や予測など、さまざまな問題に適しています。

NuPICバイナリは以下の目的で利用できます。

Linux x86 64bit
OS X 10.9
OS X 10.10
Windows 64ビット

すべてのオペレーティングシステムにNuPICをインストールするには、次の依存関係が必要です。

  • Python 2.7
  • pip> = 8.1.2
  • setuptools> = 25.2.0
  • ホイール> = 0.29.0
  • 貧弱
  • gcc(4.8+)やclangのようなC ++ 11コンパイラ

OS Xの追加要件:

  • Xcodeコマンドラインツール

NuPICをインストールするには、次のコマンドを実行します。

pip install nupic
 

正式なソースコードレポ: https : //github.com/numenta/nupic


3)ニーラム

Nilearnは、NeuroImagingデータの迅速かつ簡単な統計学習のためのPythonモジュールです。それは、予測モデル、分類、デコード、または接続解析などのアプリケーションで、多変量​​統計のためにscikit-learn Pythonツールボックスを活用します。

ソフトウェアを使用するために必要な依存関係は次のとおりです。

  • Python> = 2.6、
  • setuptools
  • Numpy> = 1.6.1
  • SciPy> = 0.9
  • Scikit-learn> = 0.14.1
  • Nibabel> = 1.1.0

nilearnプロット機能を使用している場合やサンプルを実行している場合は、matplotlib> = 1.1.1が必要です。

テストを実行するには、nose> = 1.2.1、coverage> = 3.6が必要です。

まず、上記の依存関係をすべてインストールしていることを確認してください。次に、コマンドプロンプトで次のコマンドを実行してnilearnをインストールできます。

pip install -U --user nilearn
 

正式なソースコードのレポ: https : //github.com/nilearn/nilearn/

4)アナコンダの使用

多くの科学Pythonライブラリは、Anacondaですぐに利用できます。 ここからインストールファイルを入手できます。一方で、Anacondaを使用すると、多くのパッケージをインストールしたり設定したりする必要はありません.BSDライセンスを受けていて、Python 3とPython 2で利用できる簡単なインストールプロセスがあります。一方、柔軟性は劣ります。例として、いくつかの最先端のPythonパッケージでは、numpyとAnacondaの別バージョンを使用している場合があります。しかし、この欠点は、別のPythonインストールを別途使用することで対処できます(例えば、linuxとMACではデフォルトのもの)。

Anacondaのセットアップでは、インストール場所の選択を促すメッセージが表示され、PATH追加オプションも表示されます。 PATHにAnacondaを追加すると、OSがAnaconda Pythonをデフォルトとして見つけることが期待されます。したがって、このPythonバージョンでのみ修正と今後のインストールが可能です。

AnacondaをインストールしてPATHに追加した後、入力するとUbuntu 14.04をターミナル経由で使用する

python
 

ターミナル経由のAnaconda Python

AnacondaのVoila PythonはデフォルトのPythonです。多くのライブラリをすぐに使い始めることができます。しかし、あなたが古いPythonを使いたいなら

/usr/bin/python
 

ターミナル経由のデフォルトPython

Anacondaは短い話として、Pythonで機械学習とデータ解析を開始する最も速い方法の1つです。

R言語によるインストールまたはセットアップ

パッケージは、R関数、データ、およびコンパイルされたコードのコレクションで、明確に定義された形式です。パブリック(およびプライベート)リポジトリは、Rパッケージのコレクションをホストするために使用されます。 Rパッケージの最大のコレクションはCRANから入手できます。最も人気のあるR機械学習パッケージには、次のものがあります。

1)rpart

説明:分類、回帰および生存木の再帰的な分割。 Breiman、Friedman、Olshen、Stoneによる1984年の本書の機能のほとんどの実装。

次のコードを使用してCRANからインストールできます。

install.packages("rpart")
 

パッケージをロードする:

library(rpart)
 

公式ソース: https : //cran.r-project.org/web/packages/rpart/index.html


2)e1071

説明:潜在クラス解析、短時間フーリエ変換、ファジィクラスタリング、サポートベクトルマシン、最短経路計算、バックグラウンドクラスタリング、ナイーブベイズ分類器などの機能

CRANからのインストール:

install.packages("e1071")
 

パッケージをロードする:

library(e1071)
 

正式な情報源: https : //cran.r-project.org/web/packages/e1071/index.html


3) randomForest

説明:ランダム入力を使用するツリーのフォレストに基づく分類と回帰。

CRANからのインストール:

install.packages("randomForest")
 

パッケージをロードする:

library(randomForest)
 

公式ソース: https : //cran.r-project.org/web/packages/randomForest/index.html


4)キャレット

説明:分類および回帰モデルをトレーニングおよびプロットするためのその他の機能。

CRANからのインストール:

install.packages("caret")
 

パッケージをロードする:

library(caret)
 

公式ソース: https : //cran.r-project.org/web/packages/caret/index.html