查看: 2415|回复: 2

运用计算风格学研究诗风格初探

[复制链接]
发表于 2017-4-7 08:32:58 | 显示全部楼层 |阅读模式
运用计算风格学研究诗歌风格初探
/山东  四面八方
计算风格学作为一门年轻的学科,为研究人文领域的许多现象提供了一种新颖的研究途径,国内外已经有了考证文学作品作者运用成功的案例。下面笔者试图将其运用于诗歌风格的研究。如有谬误,敬请指正。
一、研究对象
选自《中国新写实主义诗歌优秀作品选》(主编:张三醉,副主编:梁北雁,银河出版社,ISBN—978—962—475—939—6):张三醉、梁北雁、王贤臣诗歌风格。
二、主要研究方法
描述统计法;文献法;比较法;综合法。
三、研究过程
㈠确定研究样本与研究项目
研究样本:张三醉作品(22首)、梁北雁作品(10首)、王贤臣作品(15首)。
研究项目:诗歌标题;诗歌长短;诗歌句长;诗歌分段;标点符号;修辞风格。
㈡采集数据,按项目对数据进行分类统计整理与对照,对比分析
1、标题
不同作者在创作时,对每一首诗歌的标题往往非常重视,反复推敲,试图达到既能概括诗歌之内容,又言简意赅。久而久之将会形成自己特有的表达习惯,本文关注的是标题的长短。以下是三位老师诗歌标题样本字数的统计表
  
作者
  
标题基本字数(个)
标题字数分段统计(首/比率)
最少
最多
平均
14
59
10以上
张三醉
2
7
4
16/0.73
6/0.27
0/0
梁北雁
2
13
7
3/0.3
30.3
4/0.4
王贤臣
1
9
3
13/0.88
1/0.06
1/0.06
表中看到:
张三醉标题用字极端值为2和7,平均4字,相对集中;多数标题2到4个字,偏短。
梁北雁标题用字极端值为2和13,平均7字,相对分散;短、中、长标题使用频率大约各占1/3没有明显统计差异。
王贤臣标题用字极端值为1和9,平均3个字,相对分散;相当多的标题只取1—4字,凝练。
2、诗歌的长短
诗歌的长短也就是诗歌的行数,有人喜欢写长诗歌,也有喜欢写段诗歌,这也是诗人写作的一种风格。统计表如下:
  
作者
  
最少行数
最长行数
行数分组统计(首/比率)
10行一下
1130
31以上
张三醉
8
48
2/0.1
16/0.7
4/0.2
梁北雁
12
30
0/0
10/1
0
王贤臣
7
30
1/0.1
14/0.9
0/0
张三醉短、中、长诗皆有之,统计最长诗48行;2/3的诗歌集中在11—30行之间。
梁北雁,统计中的诗全在12—30行内。
王贤臣,统计中只有短篇诗和中篇诗,中篇达九成。
3、句子的长度
句子的长度,往往是体现作者诗体风格的重要指标,值得关注。
  
作者
  
最短
最长
平均
句长字数分段统计(首/比率)
10以内
1115
16以上
张三醉
3
19
9
8/0.36
9/0.41
5/0.23
梁北雁
2
20
10
4/0.4
6/0.6
0/0
王贤臣
2
20
7
2/0.13
12/0.8
1/0.07
三位诗人的句长极端值差异不明显,更多的诗句长度都集中在11—15字之间。但相比之下:
张三醉句内字数虽不是最长,但长句所占比率比梁、王二位要大,16字以上接近1/4。
梁北雁平均句长偏短,王贤臣居中。
4、诗歌的分段与段内行数
在创作中,诗歌是否分段,如何分段,可以反映出一个人的写作习惯及风格。三位诗人的诗歌分段段数统计表:
  
作者
  
不分段
二段
三段
四段
五段以上
张三醉
0
0
7
12
3
梁北雁
1
2
4
1
2
王贤臣
1
1
6
2
5
显显而易见:
张三醉喜欢分段,都在三段以上,四段诗最多。
梁北雁各种分段很接近正态分布,三段诗最多。
王贤臣分段较为广泛,三段诗居多。
当分了段以后,各段安排几行是与之密切相关的。一般认为,如果分段较多的话,各段的行数相应减少了,这样可以细化诗歌的审美数量,增加诗意或内容等,所以段内行数也是值得考查的:
  
作者
  
不分段
  
(首)
等行分段(首)
不等行分段
  
(首)
2行以内
3
4
5行以上
张三醉
0
1
0
8
11
2
梁北雁
1
0
0
1
4
4
王贤臣
1
0
1
3
8
2
张三醉的分行诗,绝大多数采取等行分诗,行数且多,集中在5行以上。不等行分诗也有。
梁北雁的分段诗,段内行数都在4行以上,等行的与不等行的没有显著差别;等行分段5行以上诗偏多。
王贤臣等行分段诗明显多于不等行分段诗,段内5行诗比例过半。。
5、标点符号
诗歌创作与其他文学作品比较而言,使用标点符号的频率或许因人不同而差别明显。这里更加关注的当然是行内的标点符号,因为行末的符号一般都被省略,故不考虑。以下是三位诗人的基本统计(单位:首)
  
作者
  
不用标点
逗号分号
叹号冒号引号问好
句号
省略号
破折号
张三醉
4
14
7
2
0
7
梁北雁
1
10
1
1
5
5
王贤臣
1
14
7
5
0
0
可见,三位诗人对标点符号的使用都很重视,频次是很高的,尤其是逗号和分号最多。相比之下,梁北雁使用最丰富,各种标点都使用过;张三醉略次之。张三醉使用破折号最多。王贤臣没有使用过省略号和破折号。
6、排比、重复、语气助词等
修辞,是文学作品不可缺少的重要手法,无需赘言。笔者在这里只对三位诗人的排比、重复句和问答(包括对话)、语气助词做了统计。(单位:首)
  
作者
  
排比
重复句
问答与对话
用过的语气助词、响声词
张三醉
3
3
2
呢、哈、啊、哦、吗、嚓、呀、么,8
梁北雁
1
1
0
0
王贤臣
7
1
0
可见,三位诗人都用过排比句,王贤臣最频繁。三位诗人也都用过重复句,张三醉最多。
张三醉诗内安排问答、对话2首。
张三醉语气助词特别丰富;王贤臣偶尔用语气助词;梁北雁没用过语气助词。
梁北雁只用了排比和重复句,频率也低。
四、基本结论
1、张三醉
标题长度2—7字,平均4字,代表性较强。
短、中、长诗皆有之,最长诗48行;大量的诗歌集中在11—30行之间。
句内字数虽不是很长,但长句所占比率颇多,16字以上行数达到所有作品四成之。正因长诗颇多故分段诗也多,多数都在三段以上,四段诗最多。而这些分行诗,绝大多数采取等行分诗,行数且多,集中在5行以上,这也与长诗的特点吻合。不等行分诗也有之。
使用破折号较多;有的诗内采取了问答、对话的表现手法。语气助词特别丰富。
2、梁北雁
标题用字极端值为2和13,平均7个字,标题偏长,相对分散;短、中、长标题使用频率没有明显差异。
样本中的诗全在12—30行内。长诗略多。在样本的各段分布,很接近正态分布,三段诗最多。等行分段的与不等行的差异不是很显著;等行分段的段内行数在4行、5行以上。
使用标点丰富,各种标点都使用过;修辞采用过排比和重复句,频率不高。
3、王贤臣
标题用字极端值为1和9,平均3字,由于分布分散,3无代表意义;风格简练。
样本中只有短篇诗和中篇诗,中篇达九成;更多的诗句长度集中在11—15字之间;分段较为广泛,三段诗居多;段内5行诗过半强;等行分段诗明显多于不等行分段诗。
没有使用过省略号和破折号;多次运用排比句。语气助词偶用。
五、几点说明
1、语体风格的分析,一般需要大量的语料做基础,方具有代表价值。而本文限于可查资料局限,只能演示一下笔者的统计思路和所运用方法而已。换句话说,最终所给出的几个基本结论不一定能反映出三位诗人的真实风格。如果读者试图给三位诗人以风格“定论”的话,还需要搜集更多的作品,重新统计方可下结论。
2、语体风格分析不仅需要描述统计,更需要推断统计,而且只有经过推断统计,才能获得较为科学而准确地结果,具有普遍性和说服力。本文限于样本容量和计算工具的制约,未能做到。拙文权当演示思路与过程,有待在继续获得更多数据资料之后,再进行推断。
3、本文考察的指标系统尚不完善。由于诗歌的修辞、表现手法丰富多彩,门派繁多,究竟应该建立什么样的指标体系系统才合适宜,还需要更多的研究者投入精力。
4、本文只是对诗歌的表达、载体、遣词造句等进行统计研究;尚不是对诗歌的内容、吟咏、思想感情等的研究。
5、本文属于纯粹学术研究,与政治、时事、诗意褒贬等无关。如果某些结论对三位诗人无意中有所碰触,还望包含、谅解。


发表于 2017-4-7 09:16:06 | 显示全部楼层
点赞并支持这种研究方式和态度!!

点评

谢谢站长支持,欢迎继续探讨。  详情 回复 发表于 2017-4-11 08:01
 楼主| 发表于 2017-4-11 08:01:13 | 显示全部楼层
观云忘我 发表于 2017-4-7 09:16
点赞并支持这种研究方式和态度!!

谢谢站长支持,欢迎继续探讨。
您需要登录后才可以回帖 登录 | 注册

本版积分规则