apriori算法的伪代码是什么意思?伪代码要出现在程序里面吗?

如题所述

伪代码是一种介于编程语言和自然语言的东东,用于描述算法,目的是既便于阅读,稍加改变后就可直接形成程序代码。
看来你初涉数据挖掘但没有计算机基础,伪代码属于基本概念。追问

我想在matlab中做apriori算法,从而实现一定的功能,需要用到伪代码吗?

追答

你怎么还不懂,伪代码是描述算法的工具,告诉程序先干什么,后干什么。就好比你要解释一个程序,一定会说先干嘛后干嘛,每个语句的目的是什么。伪代码就是这个作用,不过它更贴近于程序语言(与特定语言无关)。你要把它转化为matlab语言的代码。

追问

可不可以这样理解:我通过看伪代码了解apriori算法的具体操作步骤,就是第一步干什么、第二步干什么,然后再按照这样的思路自己在matlab中编程序???的确是初学,不懂哇~大虾别着急~

追答

对。
伪代码中所谓的思路叫做算法,即解决问题的方法。即使对于有些计算机专业的低年级,也分不清算法和写代码的区别。
所谓算法,就是解决问题的策略,比方说apriori算法,基本思想就是频繁项集间的层次关系。
有了算法,也就是解决问题的策略,根据这个思路写代码就容易了。
所以严格说,伪代码不是代码,它就是对算法的描述。(千万别把伪代码写到程序里,除非你要做注释)

追问

哇!你解释的太明白了!看样子你是个高手啦,还想请教一个问题:在matlab中,我有两个元胞数组A和B,想通过A中出现过的词条统计B中词条出现的次数,其实A是一个参照表,B才是数据表。说白了,是apriori算法找出频繁1项集,这个该怎么操作呢?

追答

如果A表不太大,把A放内存里:
扫描B表,去掉A中没有的项。扫描中,顺便统计词条次数。词条频度足够高的就忽略。整个过程只需扫描一遍数据B。
我不是高手,我只知道理论,具体写代码的能力很差。

温馨提示:答案为网友推荐,仅供参考