テキストマイニング

提供: ORWiki
2007年9月20日 (木) 20:45時点におけるSaru (トーク | 投稿記録)による版
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

【 てきすとまいにんぐ (text mining) 】

電子化された文書やWebページなどの膨大なテキストデータから, 新たな情報を発掘しようとすることをいう. 構造化されたデータベースからのデータマイニングと異なり, 構造化されてなく非定型なテキストが対象となる. また,情報検索が文書の発見を目指すのに対し, テキストマイニングはパターンや相関規則(association rule)の発見, 文書分類(document classification), トピック抽出といった新たな知識の発見を目的としている.