「テキストマイニング」の版間の差分
ナビゲーションに移動
検索に移動
Tetsuyatominaga (トーク | 投稿記録) (新しいページ: ''''【 てきすとまいにんぐ(text mining) 】''' 電子化された文書やWebページなどの膨大なテキストデータから, 新たな情報を発掘しよ...') |
|||
1行目: | 1行目: | ||
− | '''【 てきすとまいにんぐ(text mining) 】''' | + | '''【 てきすとまいにんぐ (text mining) 】''' |
電子化された文書やWebページなどの膨大なテキストデータから, | 電子化された文書やWebページなどの膨大なテキストデータから, |
2007年9月19日 (水) 21:51時点における版
【 てきすとまいにんぐ (text mining) 】
電子化された文書やWebページなどの膨大なテキストデータから, 新たな情報を発掘しようとすることをいう. 構造化されたデータベースからのデータマイニングと異なり, 構造化されてなく非定型なテキストが対象となる. また,情報検索が文書の発見を目指すのに対し, テキストマイニングはパターンや相関規則(association rule)の発見, 文書分類(document classification), トピック抽出といった新たな知識の発見を目的としている.