「テキストマイニング」の版間の差分
ナビゲーションに移動
検索に移動
3行目: | 3行目: | ||
電子化された文書やWebページなどの膨大なテキストデータから, | 電子化された文書やWebページなどの膨大なテキストデータから, | ||
新たな情報を発掘しようとすることをいう. | 新たな情報を発掘しようとすることをいう. | ||
− | + | 構造化されたデータベースからの[[データマイニング]]と異なり, | |
構造化されてなく非定型なテキストが対象となる. | 構造化されてなく非定型なテキストが対象となる. | ||
また,情報検索が文書の発見を目指すのに対し, | また,情報検索が文書の発見を目指すのに対し, |
2007年9月20日 (木) 20:45時点における最新版
【 てきすとまいにんぐ (text mining) 】
電子化された文書やWebページなどの膨大なテキストデータから, 新たな情報を発掘しようとすることをいう. 構造化されたデータベースからのデータマイニングと異なり, 構造化されてなく非定型なテキストが対象となる. また,情報検索が文書の発見を目指すのに対し, テキストマイニングはパターンや相関規則(association rule)の発見, 文書分類(document classification), トピック抽出といった新たな知識の発見を目的としている.