首页 广告发布 谈舆情监控,有这几个方面

谈舆情监控,有这几个方面

发布时间 2017-07-29 收藏 分享
价格 面议
品牌 乐客
区域 全国
来源 湖南乐客公关

详情描述:

提到搜索引擎技术,我们可以对其基本原理进行介绍:首先抓取网页(通过爬虫spider),抓取网页是通过超链接实现从一个网页到另一个网页;抓取网页之后便是对网页进行处理,提取关键字,建立索引库和索引,当然也包括一定的网页去重,网页类型分类等工作;后提供检索服务,用户输入一些关键字就会出现相关信息的排行(一定规则),我们在百度的时候搜索的时候除了提供网页的链接还会提供信息的摘要等信息。


其实在使用搜索引擎技术也在一定程度用到文本挖掘和知识管理技术,但是仅通过搜索引擎技术获取的信息还是挺粗的,我们要想得到我们需要的信息还得进行文本挖掘和知识的管理。
在谈到舆情监控,我们常常提及的词语包括,全网扫描,信息提取,分词,分类,聚类,主题监测,热点事件追踪,舆情简报。下面我将一一介绍这些:

全网扫描:指的是针对所有的网站进行网络信息的爬取,包括国内,国外的(对于一些屏蔽的网站我们可以通过境外代理采集)。




信息提取:信息提取一般是指按照相应的关键词对海量数据进行过滤之后的信息,当然信息提取也会进行内容的去重。同时也可以进行信息的情感分析,但是可能出现一定的误差。
分词:我们知道中文句子不同的词语分割会有不同的意思,比如“数据说”可以分割成数据和说,也可以说成数和据说。
分类:指的是将各类信息按照一定的分类体系进行分类整理,比如按照颜色分类,按照用途分类。
聚类:文本聚类是指将文本集合分成若干类,但是我们没有给出分类的标准。不同的类在特征空间中占据不同的区域,同一类文本在同一个区域,每个文本对应区域中的一个点。
主题监测:就是定义一个主题(比如定义一个关键词(人,机构,事件,行业等)),将主题相关的文件,新闻等进行采集,监测。
热点事件追踪:就是持续跟进那些关注度比较高的新闻或事件,关注度的确定可以通过转发次数,评论次数,关注人数,阅读的次数等。追踪的实现我们可以通过时间的先后顺序进行确定。
舆情简报:指的是通过一系列的展示手段,比如折线图,表格,饼状图等,对舆情进行一定规则的报道。
更多详情:http://www.leke123.com/

联系人 龙腾
18229922604 2825319064
2825319064@qq.com
上一条 下一条
电话联系