一、实验目的
本实验基于实验7-1和实验7-2输出的数据表,使用助睿BI完成多维度可视化探索。实验重点是通过指标卡、排名图、标题影响分析图和趋势图,对自媒体作品运营效果进行展示与解释,并最终形成综合仪表盘。
本实验使用三张数据表构建数据集:summary_all_platforms 用于展示全平台概况;content_analysis 用于制作B站和CSDN的学生排名、作品排名和趋势分析;title_feature_analysis 用于制作标题关键词影响分析图。实验手册要求从整体指标、排名分析、标题影响、趋势变化等维度进行可视化,并从图表中提炼运营洞察。
二、数据特点与分析框架
在制作图表之前,需要先明确数据特点。本次数据具有以下特征:
数据特点 | 说明 |
内容同质化 | 全班发布的作品主题较接近,主要围绕实验作业展开 |
平台相对固定 | 数据较完整的平台主要是B站和CSDN |
作品数量相近 | 每位学生发布的作品数量差异不大 |
标题存在差异 | 不同作品标题使用了不同关键词,如“保姆级”“零代码”“实战”等 |
基于这些特点,本实验的可视化分析重点如下:
分析维度 | 分析目标 | 核心问题 |
核心指标 | 了解整体数据情况 | 整体表现如何? |
排名分析 | 对比学生和作品之间的差异 | 谁做得好?什么内容表现好? |
标题影响 | 量化标题关键词对互动效果的影响 | 什么标题更有效? |
趋势分析 | 观察数据随时间变化 | 流量是否持续增长? |
三、仪表盘布局思路
本实验仪表盘采用“先总后分、左右对照”的布局方式。
区域 | 内容 | 作用 |
顶部 | 核心指标卡 | 快速展示整体情况 |
中部左侧 | B站排名、标题分析、趋势图 | 展示视频平台表现 |
中部右侧 | CSDN排名、标题分析、趋势图 | 展示图文平台表现 |
底部 | 趋势或补充分析图表 | 观察时间变化和长尾效果 |
整体阅读路径为:先通过指标卡建立整体认知,再通过排名图发现表现差异,然后通过标题影响分析定位原因,最后通过趋势图观察数据变化规律。
四、实验步骤
步骤1:连接数据源
进入助睿BI平台后,选择前面实验已经生成的数据表。由于团队私有数据库数据源通常已经完成连接,因此本实验可以直接使用实验7-1和实验7-2输出的结果表。
步骤2:构建数据集
本实验需要创建三个数据集。
数据集 | 来源表 | 主要用途 |
全平台概况数据集 | summary_all_platforms | 制作全平台作品总数、平台数、总浏览数、总互动数等指标卡 |
重点平台深度分析数据集 | content_analysis | 制作B站和CSDN的学生排名、作品排名、趋势分析 |
标题关键词互动数据集 | title_feature_analysis | 制作标题关键词平均互动数和提升倍率图 |
步骤3:制作核心指标卡
指标卡用于展示最关键的总体数据,使读者能够快速了解全班自媒体作品的整体运营情况。根据实验手册,本部分指标卡分为全平台概况和重点平台概况两类。
图表 | 数据集 | 配置方法 | 解读要点 |
全平台作品数 | 全平台概况数据集 | 对作品数量求和 | 展示全班共采集了多少作品 |
分发平台数 | 全平台概况数据集 | 对平台进行去重计数 | 展示数据覆盖了几个平台 |
全平台总浏览数 | 全平台概况数据集 | 对浏览数量求和 | 展示全平台流量规模 |
全平台总互动数 | 全平台概况数据集 | 对互动数量求和或使用计算字段 | 展示整体互动水平 |
B站作品数 | 全平台概况数据集 | 筛选平台=B站,统计作品数 | 展示B站内容体量 |
CSDN作品数 | 全平台概况数据集 | 筛选平台=CSDN,统计作品数 | 展示CSDN内容体量 |
B站总播放量 | 全平台概况数据集 | 筛选平台=B站,对浏览数量求和 | 展示B站总流量 |
CSDN总阅读量 | 全平台概况数据集 | 筛选平台=CSDN,对浏览数量求和 | 展示CSDN总流量 |
步骤4:制作排名分析图表
排名图表主要用于回答“谁做得好”和“什么内容表现好”这两个问题。学生排名侧重观察个人整体运营水平,作品排名侧重发现单篇爆款内容。
图表 | 数据集 | 配置方法 | 解读要点 |
B站学生平均播放量排名TOP10 | 重点平台深度分析数据集 | 筛选平台=B站;维度=作者名称;指标=平均值(浏览数量);降序排序;限额10 | 找出B站整体运营表现较好的学生 |
B站作品播放量排名TOP10 | 重点平台深度分析数据集 | 筛选平台=B站;维度=作品标题;指标=浏览数量;降序排序;限额10 | 找出B站单篇播放量较高的作品 |
CSDN学生平均阅读量排名TOP10 | 重点平台深度分析数据集 | 筛选平台=CSDN;维度=作者名称;指标=平均值(浏览数量);降序排序;限额10 | 找出CSDN整体阅读表现较好的学生 |
CSDN作品阅读量排名TOP10 | 重点平台深度分析数据集 | 筛选平台=CSDN;维度=作品标题;指标=浏览数量;降序排序;限额10 | 找出CSDN单篇阅读量较高的作品 |
通过学生排名和作品排名结合分析,可以先找到表现突出的学生,再进一步查看其具体作品标题、平台和互动情况,从而总结可借鉴的运营经验。
步骤5:制作标题影响分析图表
标题影响分析是本实验中较有业务价值的部分。由于作品内容较为接近,标题写法可能成为影响点击和互动的重要因素。实验7-2已经生成了 title_feature_analysis 表,因此本实验可以直接使用该表分析不同关键词的互动效果。
标题关键词提升倍率计算公式为:
提升倍率 = avg_interaction / overall_avg
如果提升倍率大于1,说明包含该关键词的作品平均互动数高于整体平均水平;如果提升倍率小于1,则说明包含该关键词的作品互动效果低于整体平均水平。
图表 | 数据集 | 配置方法 | 解读要点 |
B站标题特征提升倍率条形图 | 标题关键词互动数据集 | 筛选平台=B站;计算 avg_interaction / overall_avg;按关键词展示 | 找出B站较有效的标题关键词 |
B站标题特征对比柱状图 | 标题关键词互动数据集 | 筛选平台=B站;展示各关键词平均互动数,并设置整体平均互动水平线 | 比较不同关键词的平均互动差异 |
CSDN标题特征提升倍率条形图 | 标题关键词互动数据集 | 筛选平台=CSDN;计算 avg_interaction / overall_avg;按关键词展示 | 找出CSDN较有效的标题关键词 |
CSDN标题特征对比柱状图 | 标题关键词互动数据集 | 筛选平台=CSDN;展示各关键词平均互动数,并设置整体平均互动水平线 | 比较不同关键词在CSDN中的效果 |
步骤6:制作趋势分析图表
趋势分析用于观察播放量或阅读量随采集日期的变化情况。需要注意的是,这里的日期是采集日期,不一定是作品发布时间。因此,趋势图展示的是截至某个采集日期,平台作品累计播放量或阅读量的变化。
图表 | 数据集 | 配置方法 | 解读要点 |
B站每日播放量趋势折线图 | 重点平台深度分析数据集 | 筛选平台=B站;维度=日期;指标=求和(浏览数量) | 展示B站累计流量变化趋势 |
CSDN每日阅读量趋势折线图 | 重点平台深度分析数据集 | 筛选平台=CSDN;维度=日期;指标=求和(浏览数量) | 展示CSDN累计阅读量变化趋势 |
趋势图的解读重点包括曲线是否持续上升、是否出现拐点、是否趋于平稳。如果曲线持续上升,说明作品可能存在持续传播效果;如果先上升后平稳,说明流量可能逐渐达到平台曝光上限;如果波动较大,则可能受到发布时间、平台推荐机制或个别作品表现的影响。
步骤7:搭建综合仪表盘
完成所有图表后,将指标卡、排名图、标题影响图和趋势图整合到一个综合仪表盘中。仪表盘顶部放置核心指标卡,中部按照B站和CSDN左右分栏展示排名和标题分析,底部放置趋势分析图表。这样的布局能够让读者按照“整体情况—平台表现—标题影响—时间趋势”的顺序理解数据。
五、图表解读方法
图表类型 | 观察重点 | 分析方向 |
排名图 | 关注前3名和后3名 | 头部代表优秀实践,尾部反映常见问题 |
对比图 | 关注不同组之间的差距 | 差距大说明影响因素可能明显,差距小说明影响有限 |
分布图 | 关注数据集中区间和异常点 | 判断整体水平是否偏低,以及是否存在离群作品 |
趋势图 | 关注曲线方向和拐点 | 判断数据是持续增长、趋于平稳还是波动较大 |
散点图 | 关注两个指标之间的关系 | 判断是否存在正相关、负相关、无相关或异常点 |
六、实验结果分析
通过本实验,可以从多个维度观察自媒体作品运营情况。核心指标卡展示了整体作品规模、平台覆盖情况和总浏览互动情况,使读者能够快速了解本次数据的基本情况。排名图表进一步展示了不同学生和不同作品之间的表现差异,有助于发现表现较好的学生和具有代表性的爆款作品。
标题影响分析是本实验的重要分析部分。通过比较不同关键词对应的平均互动数和提升倍率,可以判断某些标题表达是否更容易获得用户关注。例如,如果“实战”或“教程/指南”的提升倍率高于1,说明这类标题可能更容易让用户感受到内容的实用价值,从而提升点击和互动。但在解释结果时,还需要结合样本数量判断,避免因为样本过少导致结论不稳定。
趋势分析则展示了B站播放量和CSDN阅读量随采集日期变化的情况。如果趋势线持续上升,说明作品仍在不断获得浏览;如果趋势线逐渐平稳,说明作品流量可能已经接近稳定状态。通过趋势图,可以进一步判断作品是否具有持续传播效果。
七、实验小结
本实验完整完成了从数据清洗到特征构建,再到可视化探索的全过程。实验7-1通过助睿ETL对原始自媒体数据进行清洗,输出了全平台概况表和重点平台内容分析表;实验7-2在内容分析表基础上计算互动总数并提取标题关键词特征,同时生成关键词级别的汇总表;实验7-3则基于这些结果表,在助睿BI中制作核心指标卡、排名图、标题影响分析图和趋势图,最终形成综合仪表盘。
整体来看,本实验不仅完成了数据处理流程,也体现了完整的数据分析思路:先保证数据质量,再构建具有业务意义的分析指标,最后通过可视化图表提炼运营结论。通过该实验,可以更清楚地理解自媒体运营分析中“数据清洗—特征工程—可视化洞察”之间的关系。