mining
名詞
1)鉱業,採鉱,採炭
2)地雷(機雷)敷設
コンピューター業界では,膨大な情報の中から,有益な情報を取り出す意味で使われる。
data mining データーマイニング
大量のデーターを分析し、その中に隠れている何らかの関係や規則性を見つけること。
大量のデーターから相関係数,決定木などの手法で規則性を割り出す,
現在はコンピューターで処理するのが一般的。
いわゆる,データマイニング・ツールは,ビジネスデータを分析してパターンやトレンドを発見するといった,さらに複雑なレポートを作成できる。
具体的には,価格変動の条件,売れ筋の商品など隠れた法則を発見する技術。
ただし,役に立たないもの,当たり前の規則など有用でないものをも大量に見つけだす。
従って最後に人間のチェックが必要。
手法としては,データーベースを関連するレコードの集合に分類する,
そのレコード同士の相関関係を分析する,
過去のデータ(の変化)から未来を予測する,
データの集合からほかのデータと性質が大きく異なる群を抽出する,
といったことを行う。
データー間の相関関係を求める『相関分析』,
データーを意味のあるクラスに判別する『クラス判別』,
データーを性質の類似したグループに分類する『クラスタリング』など,
いわゆる統計的な処理のほかに階層型ニューラルネットワークによる学習等も利用されている。
アメリカ政府によるデータマイニング
2004年5月27日に米会計検査院が発表した,連邦政府機関が個人情報に対して実施しているデータマイニングについての調査結果によると,実施中もしくは計画段階にあるデータマイニングプロジェクトは,政府機関52団体で199件,うち米国人の個人情報を使用しているものは122件。
また,信用調査会社やクレジットカード発行会社など民間企業からデータ提供を受けているプロジェクトは54件。
連邦機関が互いに情報を共有しているのは77件で,うち46件は奨学金申請や納税申告などの情報源から得た銀行口座や納税者番号といった個人情報を使用していた。
納税者番号を使った米国税局のプロジェクトでは,税金の還付申請の疑問点をもとに,詐欺を働いている可能性のある人物を探し出していた。
テキストマイニング
大量の文書を処理し,内容に応じた分類,傾向の分析などを行う技術。
客観的にデーターが分析できるのが特徴。
作業は,大量の文章から意味のある言葉を抽出。
言葉同士の相関係数などを分析。
分析結果をわかりやすく表示の順で行われる。
戻る 英語『M』 最初のメニュー