[深圳SEO]网路探勘的定义与介绍

小帅帅 5537 0

「网路探勘(Web Mining)」顾名思义是利用「资料探勘(Data Mining)」的技术于全球资讯网上,用以探勘网页内容、网站架构、使用者行为的方法。Cooley, Movasher and Srivastava于1997年提出网路探勘的概念,网路探勘就是把资料探勘的技术应用到全球资讯网上。网路探勘可分为三类,分别为「网站内容探勘(Web Content Mining)」、及「网站结构探勘(Web Structure Mining)」、「网站使用度探勘(Web Usage Mining)」。其中,「网站内容探勘」强调从全球资讯网上检索资讯,根据网站本身的内容进行资料探勘,其内容包括有网页内容文字、连结文字及目录结构文字;「网站结构探勘」主要是利用图形的方式来描述网站结构以及表示连结的模式,而并不描述连结的网页内容,可以利用此种模式来将网站进行分类;而「网站使用度探勘」则重视找出使用者在全球资讯网上的浏览及存取型别,以网页的日志档(web log file)为资料来源进行网页使用探勘。

(1)网站内容探勘(Web Content Mining)

「网站内容探勘」是从网页的文字、图片、以及各种组成网页的内容中挖掘资讯。应用「网站内容探勘」可以协助「搜寻引擎」、「智慧型代理程式」、「推荐机制」能够更有效的帮助网友在茫茫网海中找寻想要的内容。

(2)网站结构探勘(Web Structure Mining)

「网站结构探勘」是从网际网路的「拓蹼学(Topology)」结构中挖掘资讯,众多的网页连结关系为何?哪些网页间呈现封闭连结而形成「网际孤岛」?而「网站结构探勘」主要的目的是发掘网页连结架构下的连结模型。这个模型是根据超连结所构成的拓朴(,因此可以有效地分类并且产生网站之间关联性的资讯;另外,网站结构探勘也可以用来发掘出网站所设定的主题,并且指出特定主题的摘要。

(3)网站使用度探勘(Web Usage Mining)

「网站使用度探勘」是从使用者应用浏览器阅读页面的行为中挖掘资讯。它们阅读过哪些页面?阅读的时间有多长?它们是否点阅连结而被导引到哪些页面?从开始浏览到结帐的过程当中最常走的浏览路径序列为何?而哪些页面导致浏览者结束阅读?

「网站使用度探勘」可以说是3种网站资料探勘最有趣的一项,也就是在研究「使用者的行为」,虽然网站的内容与结构持续在变化中,但是我们可以选定某一时间点,来研究那个时间点的网站的内容与结构。但是使用者行为必定是跨时间的,时间的框架可以是单一区段或者是长达数年,但是永远会包含时间的维度。

就算是我们单纯进行「网站内容探勘」或是「网站结构探勘」,却也脱离不了「网站使用度探勘」,举例来说,研究连结时,「访客流量」就是一个很重要的变数来显示连结的重要性。当我们要分析「使用模式」时,可以针对单一区段或是从特定类型顾客这几年购买商品的行为,并进一步根据所要分析的时间框架以及资料层级作汇总,以产生汇总的顾客行为侧写,这些行为侧写可以用来作为「推荐商品」或是「个人化服务」的基础。使用「网站使用度探勘」在「提升网站使用效率」或是「提升顾客关系管理」的应用相当广泛,当应用的目标愈积极,所需要的资料来源就愈复杂。

以上三种分类,可以个别使用也可组合应用。例如,「网站内容探勘」与「网站结构探勘」都可能会牵涉到网页连结的概念,因此,Cooley, Movasher and Srivastava(1997)将两者组合以找出网页连结的相关网站。

标签: 深圳网络营销 深圳营销公司 深圳营销推广

发表评论 (已有0条评论)

还木有评论哦,快来抢沙发吧~