按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
的次数越多,所受的关注度就越高。
当今的互联网,也是唐诗传播的重要媒介,是普通读者了解、阅读和评论唐诗的重要途径。被网页载录的越多,表明这首诗的人气就越旺、被关注度就越高。
因此,我们可以借助选本的入选率和网络的链接率来统计衡量不同作品在普通读者群中的关注度。
批评型的专家读者对唐诗的批评阐释,一般有文献资料可以查考。古今批评的方式有所不同。古代的批评,大多是随机性的评点,批评家既可以在选本里点评,在诗话著作中评论,在文集序跋中评述,也可以在野史笔记中闲谈赏鉴。我们把古代这些批评资料统称为评点资料。20世纪以来,批评的言说方式和载体发生了很大变化,批评家、学者们主要是用专题研究的论文方式来对古代作品进行批评和研究。因此,有关20世纪批评家的批评数据,可以根据相关专题研究论文来统计。
古今批评家、学者对唐诗作品的批评,有褒贬,有抑扬。但无论是褒扬是贬抑,都表明批评者对作品的关注。因此,我们统计时,不分褒贬,只要是对一首诗有过书面评论或发表过研究论文的,都分别作一次统计。一首诗,被评点、研究的次数越多,表明它受关注的程度越大,影响力也就越大。
创作型的诗人,对唐诗的接受情况比较复杂。一首诗被哪些诗人效法借鉴过,大多没有显性的资料可以查证,即使有个别证据,也难以作为一种共性的客观的资料数据来统计,故而未被纳入唐诗排行统计范围。
三
为了统计唐诗在后代传播接受过程中的关注度,我们采集了四个方面的数据:历代选本入选唐诗的数据、历代评点唐诗的数据、20世纪研究唐诗的论文数据和文学史著作选介唐诗的数据。
选本方面,采集了历史上具有代表性和影响力较大的70种唐诗选本为数据来源。其中,唐人选唐诗9种,宋金元人选唐诗8种,明人选唐诗5种,清人选唐诗11种,现当代人选唐诗37种。每个选本入选的篇目,先录入计算机,经数据库处理后再统计每首诗入选的次数。一首诗被几个选本录入,就计为几次。考虑到古、今选本对名篇生成过程的影响力不同,故将选本分为古今两类统计入选次数。
评点方面,以陈伯海先生主编的《唐诗汇评》为数据来源。该书汇集了唐代以来数百种选本、诗话、笔记、序跋等文献中关于唐诗评论的资料,基本可以反映历代评点唐诗的概貌。每首诗下辑录多少条评论,就作多少条计入。
20世纪研究唐诗的论文,依据《唐代文学研究年鉴》和相关专题目录索引来统计。我们研制有《20世纪唐五代文学研究论著目录检索系统》。论文以篇计数,一部著作也计数为一。
文学史方面,选取20世纪以来影响较大的9种文学史著作作为数据采集的来源。每种文学史对不同诗歌的介绍力度有轻重之分,我们又分为全诗引录的A类和摘句介绍的B类,对于详细介绍的长篇,虽未全诗引录,也以A类计量。每入选一部文学史,即以一条统计。
另外,我们还搜集了网络链接的唐诗数据作为对比性参考资料,但没有参与综合名篇指数的计算与排名。网络数据的采集方法是,在百度和谷歌主页的搜索栏分别依次输入诗人姓名和诗题名称,检索其链接的相关网页数目。由于此项数据波动大、更新快,我们在不同的时间点作了三次检索,然后对三次结果求出平均值,以期在一定程度上改善该项数据的不稳定性,更真实地反映网络传播唐诗的流行情况。
以上四类数据(不包括网络数据),性质不同,对名篇生成的影响力也不一样。为此,我们对数据作了加权处理。每类数据的权重如何确定,在文学计量研究中还没有先例可循。但在文献计量学中,有主观赋权和客观赋权两种,其中主观赋权法主要是从定性分析的角度,根据各个指标对其反映对象影响作用的大小来确定相应指标的权重,又有专家评判法和层次分析法两种。客观赋权主要是从定量分析的角度计算各指标的权重,这有变异系数法和相关系数法两种。考虑到文学研究的具体情况,我们姑且用主观赋权中的专家评判法进行确定。
综合考量各项指标在综合测评中的影响程度后,我们将选本的权重拟定为50%,又考虑到古今选本影响力的不同,对古今选本再分别给以60%和40%的权重区分;古代评点的权重定为30%;20世纪的研究论文的权重设定为10%;文学史著作也给予10%的权重,其中全诗引录或详细介绍的A类作品和摘句或仅仅提及的B类作品,再分别给以70%和30%的“二级”权重,以区分二者影响因子的差异。
除了对各项指标进行加权计算之外,我们还对数据作了标准化处理。每项指标性质不同,量纲也不同,如选本指标一组数据的量纲是“次”,入选多少次就以多少次计数,而评点指标一组数据的量纲是“条”,论文研究指标的量纲是“篇”。因为各组指标之间没有综合性,而且各项数据不在同一数量级上,所以,如果直接参与计算,将会过分突出数量级较大的指标,而掩盖数量级较小的指标在综合评定过程中的作用。这就需要对各组数据进行标准化处理。标准化处理,在计量学中称为无量纲化,即通过一定的数学变换来消除各指标量纲的差异。常用的无量纲化方法有三种,即直线型、折线型和曲线型。我们把抽样得到的数据称为实际值,进行无量纲处理后的值称为标准值。由于抽样数据的实际值与标准值之间存在线性关系,因此我们采用直线型方法中的极值法来作无量纲处理,即用实际数据除以该组数据的最大值以得到该数据的标准值,算式为:
例如,选本指标中,古代选本部分入选次数最多的是17次(崔颢的《黄鹤楼》),现代选本中入选次数最多的是30次(王之涣的《登鹳雀楼》);王维的《送元二使安西》,在古代选本和现代选本中入选的实际值分别是13次和27次。于是,这两项实际值进行标准化处理以后分别是13/17=0。7647和27/30=0。9。经过极值法处理后的标准值都在0~1之间,越接近1,表示该值在其所在的一类指标中越占优势,从而使得各项指标具有可比性,能够参与加权计算。
每组数据进行标准化处理后,再加权求和。兹以X代表历代选本指标,P代表历代点评指标,L代表20世纪研究论文指标,W代表文学史指标,Z代表每首诗的综合得分。综合得分是以每项指标的标准值乘以各自的权重,然后求和。
算式为:,即
代入已知值并合并算式为:
试以王昌龄的《长信秋词》(奉帚平明)一诗为例,
该诗在古代选本和现代选本中分别入选了14次和16次,历代点评19条,20世纪研究中只有1篇论文以此诗为题目,文学史中A、B两类分别入选了3次和5次。那么该诗的综合评价值就是:
以这种方法将相关数据输入计算机,计算机会自动计算出每首作品的综合分值。依据每首综合分值的大小排名,就得到了唐诗名篇排行榜。
位居前一百名的唐诗名篇综合指标得分,见表1。
表1
四
我们从2005年开始尝试计量分析唐诗名篇的影响力,之后不断扩充数据,完善统计方法,先后做了四个版本的唐诗名篇排行榜。表1是最新版的排行榜,我们在《文学遗产》2008年第2期发表的《寻找经典——唐诗百首名篇的定量分析》是第二版排行榜。由于不断增补和调整数据,每个版次的排名略有不同,但变化不大,一般在几个名次内上下浮动。有意思的是,四次排行榜的第一名,都是崔颢的《黄鹤楼》。无论数据怎样增加,统计方法怎样调整变化,《黄鹤楼》始终独占鳌头,而且综合指标的分值高出第二、第三名很多,而第三名之后的分值前后相差甚小。可以说,《黄鹤楼》是当之无愧的唐诗第一名篇。
要说明的是,这个排行榜只能反映榜单内相关诗篇的关注度和影响力的大小,而不能据此评估每首诗的艺术价值和思想意义的高低。排名靠前的诗篇,我们只能说它们在长期的传播接受历程中影响力更大,但不能据此说它们的艺术价值更高、思想意义更大。文学艺术作品的人文价值和艺术价值,目前还很难用具体的数据来衡量和测度。排行榜中的诗篇,可以说都是很有名的诗,但未必都是最好的诗。境外流行有一句选举语言:选出来的不一定是最好的,但却是可以接受的。套用此语,我们可以说:排行榜中的唐诗,虽然不一定是最好的诗,却是得到公认的好诗。公认,并不是人人都认同,大多数人认同之谓也。
本排行榜的名次,是古今各项指标综合计算的结果。如果分时代统计,结果会大不一样。也就是说,这个排行榜,只反映榜内诗篇在古代和现今的综合影响力,而没有动态地反映各个历史时期不同的影响力。其实,每首诗的影响力和关注度,不同的历史时期是不同的。数据也完全能够反映出这种变化,只是上面的这个榜单无法清晰完整地呈现出来而已。比如,陈子昂的《登幽州台歌》,现如今差不多是地球人都知道的名篇,即使不晓得这首诗题目的人,也会知道“前不见古人,后不见来者”的诗句。可它在古代的知名度和影响力却很小,选家基本不选,在33种古代选本中,只有2种选本光顾到它,诗评家对它也不大理会。所以,它的综合排名比较低,落在200名之后。而有些古代影响力较大的作品,到了20世纪却备受冷落。比如,盛唐时期的崔曙,时下的读者对这名字都感到陌生,至于他的《九日登望仙台呈刘明府》就更少有人知道,现当代的选本几乎都不选,37种今人选本只有1种选入,当今的学者和文学史家也全都漠然视之。可在古代,选家和诗评家都对崔曙的这首诗青