网络舆情监控系统_互联网舆情监测系统_财经金融舆情监测

江西11选5开奖记录

您当前的位置:主页 > 舆情监控系统 >


网络舆情监控系统

 
     【1】监测渠道
    支持新闻网站、论坛、博客、微博、微信公众号、贴吧、平媒电子版、新闻APP等不同渠道的信源采集。
    (1)网站:覆盖12万多家新闻网站,包括财经门户网站、互联网金融专业网站、网贷专业网站、各地新闻类网站的金融财经频道等;
    (2)论坛:10000多家论坛,包含网贷之家、网贷天眼等金融类主流论坛;
    (3)微博:监测14亿+微博账号,每天1亿的数据量,90%在1分钟抓取,99%在30分钟以内;
    (4)贴吧:2200多万个贴吧;
    (5)报刊:2000多家电子报刊,覆盖全国31个省(区、市)发行量较大的财经、都市类报纸、期刊、杂志等;
    (6)博客:400多家国内主流博客;
    (7)新闻APP:400多家
    (8)视频:60多家主流视频平台;
    (9)问答:知乎、百度知道等30多家主流问答平台。
    (10)微信:2000万微信公众号。
    【2】采集技术优势
    采用先进的分布式架构,可以抓取海量的网页,消除单点抓取瓶颈。集群的日抓取能力达到1亿以上。并且通过抓取流量控制,IP资源池等策略,可有效防止屏蔽。同时通过智能的调度机制,可自动调整抓取周期,优先抓取更新频繁的网页,保证抓取时效性。
    【3】数据存储
    基于Hadoop分布式存储框架,利用HBase分布式数据库,采用横向扩展的集群架构,系统容量与性能可随存储节点数目线性增长,突破扩展瓶颈。存储节点随用随加,可按需在线完成系统扩展,并自动均衡数据,提供具有高可扩展、高性能、高可用的数据存储。
    【4】智能文本分析
    基于百分点文本分析系统,融合了多种先进、经典的机器学习算法,采用深度学习并结合独创的业务分析模型,优化分析结构和分析方法,使中文情感倾向性分析的准确率和分析效率方面得到很大提升,保证高效、准确地完成分析判断。
    【5】数据导出
    对于查询出来的数据,支持一键导出。导出内容包括发布时间、标题(带有超链接)、摘要、链接地址、渠道、网站、原始来源、情感、字数、关键字(包括出现次数)、作者、微博博主粉丝量、博主身份、城市、是否认证、传播力指数(根据媒体权重、新闻转载量、情感属性、关键词密度等计算的综合权重值)

上海快3APP下载 江西11选5 江西11选5走势图 内蒙快3APP下载 恒运彩票网 江苏快3APP下载 江西11选5开奖结果 江西11选5分布走势图 江西11选5走势图 江西11选5开奖结果