秦时明月吧 关注:2,815,301贴子:81,829,386

农家线共登场分析——一张社交网络图的生成(秦时分析学新方法系

只看楼主收藏回复

列之三)


IP属地:北京1楼2017-07-24 22:14回复
    看着好悲情


    IP属地:四川来自Android客户端2楼2017-07-24 22:16
    回复
      啧啧


      IP属地:辽宁来自Android客户端3楼2017-07-24 22:17
      回复
        (一)亲密度矩阵的构造
        1.共现分析(Co-occurrenceAnalysis)介绍

        2.影视作品中的“共现”
        由此我们可以想到,我们可以把这种分析方法引入到故事中人物关系的分析上来。我们只要把1中的“文档”替换为“场景”,“关键词”替换成“角色”,共现分析就成了“共登场分析”——如果两个角色在同一个场景中出现,意味着两者发生了联系。我们可以把包容度重新定义为亲密度,包容矩阵成为亲密度矩阵。
        3.场景划分与角色登场表的建立
        角色登场表,我们可以这样设置:纵轴是角色,横轴为场景,如果一个角色在一个场景中出现,我们就在对应的位置写上1.如果我们有秦时的剧本的话,建立登场表就简单许多了,剧本一般会分出场景,每个场景有谁登场都十分清楚。然而我们没有。
        因此,我们只能自己来分。我观看了秦时明月之君临天下第45集到第66集的内容,做成了下表。


        角色共计43个,场景共有86个。
        由于本人没有学过编剧或导演,因此场景的划分我都是按照自己对秦时明月中空间的理解来进行的。并且为了方便,不同集数的相同场景,我都按不同场景来算;同一集中的相同场景,在没有相连的情况下(秦时的剪辑你们是知道的),如果没有新人物登场,算同一场景,有新人物登场,算不同场景。这就是我划分场景的基本原则。
        在有了这张表之后,我们就可以生成亲密度矩阵了。我们把这张表导入R来做这件事。代码如下:

        写代码本人并不擅长,如果写复杂了,望诸位莫取笑。解释一下这段代码:我们任意找到两行,将两行对应的元素相加,新的向量中2的个数就是对应的两个角色的共登场的次数。我们再找出两个角色的总登场次数中小的那一个,二者相除,就是两角色的亲密度。确实如大家所说,R运行for比较慢,这段代码R运行了将近30秒才完成。
        于是,我们得到亲密度矩阵如下图。

        让我们把它做得更漂亮些。(1.07M,建议下载查看)


        IP属地:北京本楼含有高级字体4楼2017-07-24 22:18
        收起回复


          IP属地:福建来自iPhone客户端5楼2017-07-24 22:20
          回复
            至此,我们本应该利用CiteSpace软件生成亲密度图谱,奈何本人之前从未用过该软件,目前还玩不转,只好就此作罢。
            但本文不会就此结束!
            二.农家线秦时角色社交网
            实际上,只要我们将之前的代码稍作修改,就可以得到邻接矩阵。

            这里我们生成的是带权邻接矩阵。
            什么是邻接矩阵?
            我们把一个角色看成一个节点,如果两角色发生过联系,即共同登场过,则用一条线连接两点,这样便能生成一张图。

            上图左边是一个无向图,右边是它的邻接矩阵,若左图两点之间有连线则右图矩阵对应的位置上就写上1。这样,一个邻接矩阵就可以描述一张图。如果连接两点的边是有权重的,就用带权邻接矩阵来描述,权重是多少就在对应的位置写多少。
            我们生成的矩阵x就是一个无向图的带权邻接矩阵。

            实际上,这个矩阵,跟共现分析中的共现矩阵几乎一样,区别仅仅是对角线相同角色的位置,一个要求为0,另一个就是原来的频次。可以说,这两个东西,从原理上讲是一样的。
            下面,我们借助R语言中的igraph包来生成秦时农家线角色的社交关系图,代码如下。


            IP属地:北京本楼含有高级字体7楼2017-07-24 22:24
            收起回复
              这图不错,楼主高明。


              IP属地:四川8楼2017-07-24 22:26
              回复
                66


                IP属地:内蒙古来自Android客户端9楼2017-07-24 22:27
                回复
                  这样一看第五部多了好多新人物


                  IP属地:广东10楼2017-07-24 22:27
                  回复
                    生成的图如下。(1.23M,点击查看大图)

                    该图中,每一个角色用一个圆代替,圆越大登场次数越多。线的宽度反映权重,线越宽,两角色间权重越大,即共登场次数越多。


                    IP属地:北京11楼2017-07-24 22:28
                    回复
                      我们还可以来个聚类分析,或者说社区发现,方法我选随机游走,结果如下。(1.23M,点击查看大图)

                      蒙恬那一部分和赵高那一部分我就直接省略了,我们可以明显看到分出了两个大类,而田言、大铁锤、高渐离这一小类起到了连接和纽带的作用。这个图和之前的社交网络图都非常直观,我就不多解释了。


                      IP属地:北京12楼2017-07-24 22:30
                      回复
                        秦时分析学新方法前两部分见:
                        https://tieba.baidu.com/p/5093622440


                        IP属地:北京13楼2017-07-24 22:37
                        回复
                          楼主一定是学霸级的人物


                          IP属地:广东来自iPhone客户端14楼2017-07-24 22:41
                          收起回复
                            仔仔细细看完了,虽然还是似懂非懂。
                            楼主这么细致认真,一定用了不少时间和精力来仔细看,想必也能看到一些我们没有注意到的地方,请问你对剧情有什么高论呢?


                            IP属地:四川15楼2017-07-24 23:18
                            收起回复
                              貌似没什么大用


                              IP属地:广东来自Android客户端16楼2017-07-24 23:31
                              回复