機械学習・AIオンライン機械学習向け分散処理フレームワークJubatusのご紹介

オンライン機械学習向け分散処理フレームワークJubatusのご紹介

機械学習とは・・・

データをコンピュータ・プログラムに「学習」させ(データに潜むパターンや規則性を表す「特徴モデル」を自動的に構築させ)、他のデータにそのモデルを適用することで、人間が行っているような複雑で柔軟な判断が行えるようになる仕組みです。


機械学習の活用例・・・

  • レコメンド(ユーザーや商品の類似度を学習)
  • 迷惑メール判定(過去に迷惑メールとされたもののパターンを学習)
  • ユーザー行動分析(望ましい/望ましくない結果に至る行動パターンを学習)
  • 画像パターン認識

Jubatusとは・・・ 

Jubatusは「分散したデータ」を「常にすばやく」「深く分析」することを狙った分散基盤技術です。

Jubatusの名前の由来は、俊敏な動物であるチータの学術名からの命名で、「ユバタス」と読みます。株式会社Preferred NetworksとNTTソフトウェアイノベーションセンタが共同開発した、日本発のオープンソースプロダクトです。

最終的に全ての人にスケーラブルなオンライン機械学習フレームワークを提供することがJubatusの目標です。

Jubatus は以下の特徴を持ったオンライン機械学習向け分散処理フレームワークです。

  • オンライン機械学習ライブラリ: 多値分類、線形回帰、推薦(近傍探索)、グラフマイニング、異常検知、クラスタリング
  • 特徴ベクトル変換器 (fv_converter): データの前処理と特徴抽出
  • フォルトトレラントな分散機械学習のためのフレームワーク

http://jubat.us/ja/より引用

Jubatusでできること

  • 1.Classifier ・・・ データの分類
  • 2.Regression ・・・ 回帰分析とその結果に基づく予測(R△)
  • 3.Recommender ・・・  類似するレコードの抽出
  • 4.Graph ・・・ 最短経路の探索
  • 5.Stat ・・・ 基本統計量の算出(R)
  • 6.Anomaly ・・・ 外れ値の検出(R)

※(R)・・・統計パッケージRにもできること

1.Classifierの機能

入力データを複数グループに分類する機能。ユーザーがあらかじめグループ分けの例を学ばせておき、定義した文字情報をキーとして分類が行われる。
利用例・・・スパムメールの判定など


2.Regressionの機能

線形回帰機能(Regression)とは、回帰分析から得られた予測式に基づき、
入力データから、出力データを推定する機能。
利用例・・・季節商品の販売数予測、消費電力量の予測など


3.Recommenderの機能

類似するデータの推薦やデータ中の同属性の推薦を行う機能。与えられたデータ(数値や文字列)の類似度合いから、各レコードに近いレコードを近い順位表示する。
利用例・・・検索サイト連動広告やECサイト商品おすすめなど


お問い合わせ

ご意見・ご質問などお気軽にお問い合わせ下さい。
ナカシャクリエイテブ株式会社

●名古屋 TEL : 052-895-1132 FAX : 052-895-1120
〒468-8533 名古屋市天白区井の森町205  地図
R&Dセンター

Email:メールでのお問い合わせ