python可以做数据挖掘吗

如题所述

文本挖掘的常用工具:Python

拓展知识:

文本挖掘(TextMinin)是一个从非结构化文本信息中获取用户感兴趣或者有用的模式的过程。文本挖掘的主要目的是从非结构化文本文档中提取有趣的、重要的模式和知识。可以看成是基于数据库的数据挖掘或知识发现的扩展。

文本挖掘是从数据挖掘发展而来,因此其定义与我们熟知如的数据挖掘定义相类似。但与传统的数据挖掘相比,文本挖掘有其地特之处,主要表现在:文档本身是半结构化或非结构化的,无确定形式并且缺乏机器可理解的语义;

而数据挖掘的对象以数据库中的结构化数据为主,并利用关系表等存储结构来发现知识,文本挖掘是指以大量文本教据中抽取事先末知的、可理解的、最终可用的知识的过程,同时运用这些知识更好地组织信息以便将来参考。

文本挖掘的主要用途是以原本未经处理的文本中提取出未知的知识,但是文本挖掘也是一项非常困难的工作,因为它必须处理那些本来就样糊而目非结构化的文本数据,所以它是一个多学科杂的领域涵盖了信息技术、文本分析、模式识别、统计学、数据可视化、数据库技术,机器学以及数据挖掘等技术。

文本挖插是以数据挖掘发展而来,因此其定义与我们熟知的数据挖掘定义相类似。但与传统的数据挖掘相比,文本挖掘有其中特之处,主要表现在:文档本身是半结构化或非结构化的,无确定形式并目缺乏机器口理解的语义;

而数据控掘的对象以数据库中的结构化数据为主,并利用关系表等存储结构来发现知识,因此,有些数据挖掘技术并不适用于文本挖掘,即使可用,也需要建立在对文本集预处理的基础之上。

文本挖掘是应里驱动的。它在商业智能、信息检索、生物信息外理等方面都有广泛的应用:例如,客户关系管理,自动邮件回复,拉圾邮件过滤,自动简历评审,搜索引擎等等

文本挖掘的主要支撑技术:自然语言处理和机器学习由于处理的对象是半结构化或非结构化的文档自然语言处理技术成为实现生物医学文本挖掘的主要技术手段。

温馨提示:答案为网友推荐,仅供参考
相似回答