情報化が進んだ現代、ビッグデータはあらゆる場面で活用されています。データをもとにした戦略立案は信頼性が高く、実際に多くの企業が営業活動やマーケティング活動にデータを活用していることでしょう。

そんな、データを活用した分析手法に、「データマイニング」というものがあります。
データマイニングは人が予測できない物事のパターンを見出すのに効果的であり、AIの機械学習との組み合わせでより高度な分析が期待できる分析手法です。

今回は、この「データマイニング」について、詳しく解説していきます。

データマイニングとは

データマイニング(Data mining)とは、統計学やAIを用いた分析により、大量のデータから、データに含まれるパターンや相関関係などといった有用性のある情報を見つけ出す分析手法を指します。
マイニング(mining)は「採掘」という意味の英単語であり、「データから有用な情報を採掘する」という意味でこのように呼ばれています。

データマイニングにより見つ出されたパターンや相関関係などの情報は、営業活動やマーケティング活動に活用できます。例えば、データマイニングによって「Aが売れる日はBの売り上げも高い」というパターンが示された場合には、AとBの売り場を隣にするなどの方法で、売上増加を目指すことが可能になります。

このようなデータマイニングは、情報化社会における情報量の増加と情報技術の発展によって成り立っています。大量のデータとそれを即座に分析できる機器があるからこそ、それまで見えていなかったデータのパターンや相関関係を割り出すことができるようになったのです。

データマイニングと統計解析の違い

データマイニングとよく似た言葉に「統計解析」というものがあります。その意味と言葉の違いについて確認しておきましょう。

統計解析とは、下記のようなことを指します。

◆統計解析とは
大量のデータを収集・分析し、そのデータをさまざまな視点から仮説を立て検証することで、データに含まれるパターンや相関関係を見出していく手法のこと。

統計解析の意味を聞くと、「データマイニングと同じでは?」と思う人もいるかもしれません。しかし、データマイニングと統計解析には明確な違いがあります。
それが、「仮説の取り扱い」です。

データマイニングの時点で存在するのは、データからの確かな情報だけです。データマイニング後、担当者はデータマイニングの情報をもとに、仮説を立てていきます。
一方の統計解析では、仮説が先。まず仮説を立ててから、それを検証するために分析を行います。

つまり、データマイニングは仮説を立てるため、
統計解析は仮説を検証するために行われる作業
であり、それぞれ目的が異なるのです。

データマイニングとビッグデータの違い

次に、データマイニングとビッグデータについて違いを解説していきましょう。

◆ビッグデータとは
膨大な量のデータの集まりのこと。種類や量に定義があるわけではなく、さまざまな種類や形式の情報が含まれ、その情報はデジタル機器の利用などにより日々記録されている。

つまり、ビッグデータとは膨大な量のデータのこと。一方のデータマイニングは、前述の通り、膨大な量のデータから有用な情報を見つけ出す分析手法のことです。

このように、データマイニングとビッグデータは全く異なる言葉ですが、これらには深い関係性があります。
それは、データマイニングがビッグデータを活用した分析手法であるという点。データマイニングは膨大な量のデータがあってこそ成立する手法であり、ビッグデータがなければデータマイニングは行えません。

データマイニングの分析手法

データマイニングの分析手法は、大きく3つに分けられます。それが、「ロジスティック回帰分析」、「クラスター分析」「マーケット・バスケット分析」
それぞれ詳しくご説明します。

ロジスティック回帰分析

ロジスティック回帰分析とは、「2値の結果」の発生確率を予測する手法のこと。「2値の結果」とは、「はい」「いいえ」で定義できるような、答えが2種類しかない値のことを指します。

ビジネスにおいて、ロジスティック会議分析は、マーケティング施策に対する顧客の反応予測のためなどに用いられます。

クラスター分析

クラスター分析とは、さまざまなものが混ざっている集まりから、似た条件のものを集めクラスターを作ることで、ものを分類する分析手法のこと。
ビジネスでは、ひとりひとりの顧客に合ったマーケティング施策実行のため、購買データから似た条件の人をセグメンテーションする場合に活用されます。

マーケット・バスケット分析

マーケット・バスケット分析とは、データの相関関係を見つける分析手法
「どの商品とどの商品が同時に購入されやすいか」「どの商品はどんな顧客に購入されやすいか」などといった、売上データから見出された相関関係を販売戦略に反映させることで、企業は売上アップを狙います。

データマイニングを活用した機械学習

AIにデータマイニングを実行させることで機械学習が進めば、AIが与えられたデータから自動的にパターンや相関関係を導き出しすことが可能になります。これにより、人の手による分析では見出せなかった有用なパターンや相関関係が発見される可能性が期待できます。
そうして得た情報を学習し、AIはより高度なレベルで活躍するようになるでしょう。

データマイニングとAIの機械学習との組み合わせは、大いなる可能性を秘めていると言えます。

データマイニングの活用事例

最後に、データマイニングの活用事例を2つご紹介します。

ワークマンの事例

作業服やアウトドアウェアを展開する株式会社ワークマンでは、発注業務にデータマイニングを活用しています。

それが、「完全自動発注システム」というもの。
販売実績や気候などのデータから商品の需要を予測し、各店舗在庫に応じた必要数を自動発注するデータマイニングシステムです。
このシステムは、無駄のない的確な商品発注や発注業務の手間削減を実現しました。

「完全自動発注システム」はワークマンの約半数の店舗に導入され、導入店舗では売上アップが報告されています。

株式会社ジャパンネット銀行(現PayPay銀行株式会社)の事例

数値情報の分析がデータマイニングと呼ばれるのに対し、文字情報の分析はテキストマイニングと呼ばれます。テキストマイニングもデータマイニング同様の仕組みで、さまざまな経済活動に活用されています。

ネット銀行であるジャパンネット銀行(現PayPay銀行株式会社)では、カスタマーセンターに寄せられる膨大な数の問い合わせ対応にテキストマイニングを導入。テキストマイニングによって膨大な問い合わせの中でも問題点が明確化され、さらに埋もれやすい意見も汲み取られることから、顧客の声をより的確にサービスへと反映させることに成功しました。
テキストマイニングツールによって問い合わせ処理時間は大幅に削減され、問い合わせ対応担当者の負担も軽減されるなど、大きな成果を挙げています。

まとめ

パソコンやスマホだけでなく、車や住宅、インフラ設備までもがインターネットに接続され、日々情報を発信・受信している現代において、データの重要性は高まりを見せています。これらの機器などから収集されるビッグデータをもとにしたデータマイニングは、ビジネスにおける主要な手段となっていくでしょう。

データマイニングを活用すれば、それまで見えていなかった法則性を発見し、それを営業やマーケティングに生かして売上を上げることができます。アナログな方法での分析で成果が見られない場合、データマイニングツールの導入を検討し、企業の競争力アップを図るのもひとつの方法でしょう。