多媒体新闻热度的简单数据分析+可视化记录
多个社交媒体平台中的新闻热度分析
### 研究背景
本研究旨在探索特定话题经济、微软、奥巴马和巴勒斯坦在不同媒体上的热度表现,以及分析不同话题和不同媒体上新闻热度的差异。
### 数据简介
此数据集包含8个月(2015年11月至2016年7月)内,关于四大主题(经济、微软、奥巴马和巴勒斯坦)的新闻数据,涉及Facebook、Google+和LinkedIn等媒体平台。数据集专为预测分析任务设计,允许在主题检测、情感分析、新闻推荐等领域进行研究。
新闻数据变量包括:IDLink、标题、标题标题、来源、主题、发布日期、文本情感分数(标题和标题)、Facebook热度、Google+热度和LinkedIn热度。
### 数据整理与变换
数据整理后,揭示了新闻热度与时间、媒体和平台间的关联。
## 分析角度
### 时间维度:一天时段热度、月热度
描述:一天中,新闻热度从1:00至9:00偏低,9:00起逐渐上升,于17:00达到高峰,随后下降至23:00。0:00处的热度异常偏高,可能因数据集中多个新闻热度异常。
分析:1:00至9:00为人们睡眠时间,新闻热度较低;9:00至17:00为工作活跃期,新闻热度上升;17:00至23:00人们开始娱乐生活,新闻热度保持高位。
### 媒体维度:发布新闻数量、主题分布、平台分布
描述:Bloomberg发布新闻数量最多,NPR和BBC发布最少;MSP、WinBeta、ZDNet专门发布微软主题新闻。
分析:选择新闻发布时,考虑媒体的受众和新闻类型,以提升新闻曝光率。
### 平台维度:热度分布、主题分布
描述:Facebook拥有最高用户量,obama主题新闻在Facebook上热度最高。
分析:选择平台发布新闻时,优先考虑用户量大、热度高的平台。
### 新闻维度:分布状况、标题共情指数、简介共情指数、新闻增长
描述:新闻热度与标题、简介共情指数关系不大;不同主题下,共情指数对热度影响不显著。
分析:新闻内容的吸引力是决定热度的关键因素。
## 数据可视化及实验结论
时间维度:新闻热度在一天内呈现规律性波动,高峰出现在17:00,异常高峰在0:00。
媒体维度:Bloomberg在经济主题上发布最多新闻,而MSP、WinBeta、ZDNet专攻微软主题。
平台维度:Facebook上新闻热度显著高于其他平台,obama主题新闻在Facebook上表现最佳。
新闻维度:新闻热度与标题、简介共情指数关联较小,主题对热度影响不显著。
时间上,新闻发布时间应避开1:00至9:00,集中于11月至次年2月,以充分利用假期期间的高活跃度。
媒体上,选择新闻发布的媒体时,应考虑媒体的受众、主题和发布数量,以提高新闻曝光率。
平台上,优先选择用户量大、热度高的平台发布新闻,以获得更高的关注。
新闻内容上,确保新闻内容的质量和吸引力,而非标题或简介的情感指数。
通过上述分析,为新闻发布的策略提供了数据支持和指导原则。
多重随机标签