データマイニング
種々の統計解析手法を用いて大量の企業データを分析し、隠れた関係性や意味を見つけ出す知識発見の手法の総称、またはそのプロセスのこと。「マイニング」は「採掘」の意。データウェアハウスなどに蓄積された膨大なデータを「鉱山」に見立て、そこから未知の知見や規則性という“鉱石”を「発掘する」という意味が込められている。
データマイニングにおける統計・解析アルゴリズムは、相関ルール、クラスタリング、ニューラルネットワーク、遺伝アルゴリズムなど数多くがある。ビジネスの分野では、「決定木分析(ディシジョンツリー)」で顧客特性や傾向を分析したり、「重回帰分析」で過去の実績データから今後の方向性を予測したりといった形で利用される。具体事例としては、商品の併売傾向(どの商品とどの商品の組み合わせが最も売れるか)を測る「マーケットバスケット分析」が有名である。
「おむつを買った人はビールを買う傾向がある」というおむつとビール(diapers and beer)という米国におけるマーケットバスケット分析の事例が、1990年代半ばから2000年代初めにかけてメディアや講演などでよく語られ、データマイニングという言葉と概念を一躍有名にした。
データマイニングにおける統計・解析アルゴリズムは、相関ルール、クラスタリング、ニューラルネットワーク、遺伝アルゴリズムなど数多くがある。ビジネスの分野では、「決定木分析(ディシジョンツリー)」で顧客特性や傾向を分析したり、「重回帰分析」で過去の実績データから今後の方向性を予測したりといった形で利用される。具体事例としては、商品の併売傾向(どの商品とどの商品の組み合わせが最も売れるか)を測る「マーケットバスケット分析」が有名である。
「おむつを買った人はビールを買う傾向がある」というおむつとビール(diapers and beer)という米国におけるマーケットバスケット分析の事例が、1990年代半ばから2000年代初めにかけてメディアや講演などでよく語られ、データマイニングという言葉と概念を一躍有名にした。






















