データをコンピュータ・プログラムに「学習」させ(データに潜むパターンや規則性を表す「特徴モデル」を自動的に構築させ)、他のデータにそのモデルを適用することで、人間が行っているような複雑で柔軟な判断が行えるようになる仕組みです。
Jubatusは「分散したデータ」を「常にすばやく」「深く分析」することを狙った分散基盤技術です。
Jubatusの名前の由来は、俊敏な動物であるチータの学術名からの命名で、「ユバタス」と読みます。株式会社Preferred NetworksとNTTソフトウェアイノベーションセンタが共同開発した、日本発のオープンソースプロダクトです。
最終的に全ての人にスケーラブルなオンライン機械学習フレームワークを提供することがJubatusの目標です。
Jubatus は以下の特徴を持ったオンライン機械学習向け分散処理フレームワークです。
※(R)・・・統計パッケージRにもできること
入力データを複数グループに分類する機能。ユーザーがあらかじめグループ分けの例を学ばせておき、定義した文字情報をキーとして分類が行われる。
利用例・・・スパムメールの判定など
線形回帰機能(Regression)とは、回帰分析から得られた予測式に基づき、
入力データから、出力データを推定する機能。
利用例・・・季節商品の販売数予測、消費電力量の予測など
類似するデータの推薦やデータ中の同属性の推薦を行う機能。与えられたデータ(数値や文字列)の類似度合いから、各レコードに近いレコードを近い順位表示する。
利用例・・・検索サイト連動広告やECサイト商品おすすめなど
●名古屋 TEL : 052-895-1132 FAX : 052-895-1120
〒468-8533 名古屋市天白区井の森町205 地図
R&Dセンター