(一)亲密度矩阵的构造1.共现分析(Co-occurrenceAnalysis)介绍
2.影视作品中的“共现”
由此我们可以想到,我们可以把这种分析方法引入到故事中人物关系的分析上来。我们只要把1中的“文档”替换为“场景”,“关键词”替换成“角色”,共现分析就成了“共登场分析”——如果两个角色在同一个场景中出现,意味着两者发生了联系。我们可以把包容度重新定义为亲密度,包容矩阵成为亲密度矩阵。
3.场景划分与角色登场表的建立
角色登场表,我们可以这样设置:纵轴是角色,横轴为场景,如果一个角色在一个场景中出现,我们就在对应的位置写上1.如果我们有秦时的剧本的话,建立登场表就简单许多了,剧本一般会分出场景,每个场景有谁登场都十分清楚。然而我们没有。
因此,我们只能自己来分。我观看了秦时明月之君临天下
第45集到第66集的内容,做成了下表。
角色共计
43个,场景共有
86个。
由于本人没有学过编剧或导演,因此场景的划分我都是按照自己对秦时明月中空间的理解来进行的。并且为了方便,不同集数的相同场景,我都按不同场景来算;同一集中的相同场景,在没有相连的情况下(秦时的剪辑你们是知道的),如果没有新人物登场,算同一场景,有新人物登场,算不同场景。这就是我划分场景的基本原则。
在有了这张表之后,我们就可以生成亲密度矩阵了。我们把这张表导入R来做这件事。代码如下:
写代码本人并不擅长,如果写复杂了,望诸位莫取笑。解释一下这段代码:我们任意找到两行,将两行对应的元素相加,新的向量中2的个数就是对应的两个角色的共登场的次数。我们再找出两个角色的总登场次数中小的那一个,二者相除,就是两角色的亲密度。确实如大家所说,R运行for比较慢,这段代码R运行了将近30秒才完成。
于是,我们得到亲密度矩阵如下图。
让我们把它做得更漂亮些。(1.07M,建议下载查看)