ラベル R の投稿を表示しています。 すべての投稿を表示
ラベル R の投稿を表示しています。 すべての投稿を表示

2017-11-26

Rで機械学習:K-meansでアヤメの種類を分類する

「非階層クラスター分析」とは

 非階層クラスター分析とは、異なる性質のものが混ざり合った集団から、互いに似た性質のものを集め、クラスターを作る1つの方法です。階層クラスター分析とは異なり、階層構造を持たず、あらかじめいくつのクラスターに分けるかを決定し、決めた数のクラスターにサンプルを分割する方法です。具体的には下記のようなイメージです

何を読み取るのかが重要--統計言語「R」でクラスター分析 - (page 3) - ZDNet Japan https://japan.zdnet.com/article/35052079/3/

Rで機械学習:ランダムフォレストを使って、新規ユーザーの属性データから、1カ月後のアクティブユーザー数を予測する

前回、Rで機械学習:サポートベクターマシン(SVN)を使って、新規ユーザーの属性データから、1カ月後のアクティブユーザー数を予測するで、サポートベクターマシンを使い、


  • 新規登録ユーザー500人の属性データから、未知データをあてはめて、1カ月後アクティブかどうか予測する


というお題をやってみました。
今回は、同じことを教師あり学習の代表格、ランダムフォレストでやってみたいと思います。

ランダムフォレスト(英: random forest, randomized trees)は、2001年に Leo Breiman によって提案された[1]機械学習のアルゴリズムであり、分類、回帰、クラスタリングに用いられる。決定木を弱学習器とする集団学習アルゴリズムであり、この名称は、ランダムサンプリングされたトレーニングデータによって学習した多数の決定木を使用することによる。対象によっては、同じく集団学習を用いるブースティングよりも有効とされる。

手を動かしながら学ぶ ビジネスに活かすデータマイニング
尾崎 隆
技術評論社
売り上げランキング: 141,877

Rで機械学習:サポートベクターマシン(SVN)を使って、新規ユーザーの属性データから、1カ月後のアクティブユーザー数を予測する

ついに機械学習に入ります。今回はサポートベクターマシン(SVN)。この本マジでわかりやすい。


手を動かしながら学ぶ ビジネスに活かすデータマイニング
尾崎 隆
技術評論社
売り上げランキング: 141,877

Rで回帰木分析 飲食点の売り上げを気温、花火大会の回数、CMの実施回数から分析する

Rで回帰木について実際に手を動かしてお勉強しますと。飲食点の売り上げを気温、花火大会の回数、CMの実施回数から分析します。


手を動かしながら学ぶ ビジネスに活かすデータマイニング
尾崎 隆
技術評論社
売り上げランキング: 141,877


R-決定木 どのキャンペーンページが効果的だったか分析する

決定木とは

さて、この本で決定木を勉強します。


手を動かしながら学ぶ ビジネスに活かすデータマイニング
尾崎 隆
技術評論社
売り上げランキング: 141,877

  • 決定木とは、できるだけ外れているものをよけるように条件分岐して順番を決めていくアルゴリズム
  • 説明変数はカテゴリ型でも数値型でもどちらでも大丈夫。

R-ロジスティック回帰分析 通販サイトにおける商品購入率をキャンペーン商品の価格で説明してみよう

本日もせっせと勉強します


TJO氏の本でね。今日はロジスティック回帰分析を手を動かしながら勉強します。


手を動かしながら学ぶ ビジネスに活かすデータマイニング
尾崎 隆
技術評論社
売り上げランキング: 131,451

2017-11-21

Rで重回帰分析 オゾン濃度と気象データの関係を重回帰分析して予測する

この本のコードを写経しています。

手を動かしながら学ぶ ビジネスに活かすデータマイニング
技術評論社 (2014-08-22)
売り上げランキン



Rのデフォルトで存在するデータセットを使って、重回帰分析をしてみたいと思います。

2017-08-20

> Error in loadNamespace(j <- i[[1L]], c(lib.loc, .libPaths()), versionCheck = vI[[j]]) there is no package called ‘Rcpp’

やりたいこと


・R Studioにggplot2をインストールし、呼び出す
・library(ggplot2)を実行する

現状


・gglot2をインストールし、library(ggplot2)を実行すると、以下のエラーが起こる

> library(ggplot2)
Error in loadNamespace(j <- i[[1L]], c(lib.loc, .libPaths()), versionCheck = vI[[j]])
there is no package called ‘Rcpp’


打開策


ネットでいろいろ調べてみたら、どうやらセキュリティソフトが邪魔してうまくいかなかったみたい。そこでカスペルスキーの保護をいったん削除して実行してみる。



結果成功した。



注目の投稿

めちゃくちゃ久しぶりにこのブログ書いたw 更新3年ぶりw > 多様性というゲームは尊厳と自由を勝ち取るゲームなのかもしれないな。  もともとツイッターでツイートした内容なんだけど、ちょっと深ぼる。 ----- 自分は男 x 30代x 二児の父 x 経営者 x 都心(共働き世...