用大数据可以统计出文学写作的规律吗


伟大的小说都是怎么开头的?

这个话题看起来并不难回答,稍有阅读经验的读者,哪怕没读过完整的作品,也能流利里说出很多经典作品的开头,比如托尔斯泰的《安娜·卡列尼娜》,“幸福的家庭都是相似的,不幸的家庭各有各的不幸”;狄更斯的《双城记》,“这是最好的年代,这是最坏的时代”;马尔克斯的《百年孤独》,“多年以后,奥雷连诺上校站在行刑队面前,准会想起父亲带他去参观冰块的那个遥远的下午”;纳博科夫的《洛丽塔》,“我的生命之光,我的欲念之火”。

小说的开篇最难写,这几乎是公认的,很多作家因为一个好的小说开篇迟迟不敢动手,有的作家甚至退而求其次,会先从结尾处写起,等小说完成得差不多的时候,再重新考虑开篇,并希望在此时能够有个更能打动人心的起始部分。但是,实话说,好的开篇是可遇不可求的,在你下笔的刹那,你并不知道你写下的是个糟糕的句子,还是令人难忘的开头。美国有个专栏作家叫本·布拉特,他用大数据对很多经典小说的开头做了一个分析。他选用了二十部经典作品的开头,除了开篇我提到的几部小说外,还有简·奥斯汀的《傲慢与偏见》,赫尔曼·梅尔维尔的《白鲸》,西尔维亚·普拉斯的《钟形罩》,奥威尔的《1984》等等。布拉特总结说,这二十部作品中,有12部作品的开篇都是使用了简短的句子,比如加缪的《局外人》,“今天妈妈死了”;托马斯·品钦的《万有引力之虹》,“尖啸声划破了长空”;《白鲸》,“叫我实玛利”。尤其是《白鲸》的这个开头得到过很多作家的赞许,像玛格丽特·阿特伍德就认为“‘叫我实玛利’,这三个词饱含力量。为什么是实玛利?那不是他的真名。他在对谁说话?”而另外一位畅销书小说家斯蒂芬·金在一次采访中说出他最喜欢的小说开头,平均下来只有六个字。换句话说,简短的开头会给人留下深刻的印象。

用大数据可以统计出文学写作的规律吗


但是,布拉特的这个统计数据并不能让我觉得信服。就算他选取的二十部作品中有十二部作品是简短的句子开头,这并不能证明写简短的开篇就能给人留下好的印象,因为剩余的八部作品中以长句子开篇,同样会让人难忘。布拉特整了一堆的数据,最后也不得不承认“观察前二十名的句子可以看到,它们的共同之处并不是长度,而是一定的独创性,让人难忘。无论句子长短,都可以做到这一点。也就是说,让这些句子进入榜单的,是那些出人意料、令人难忘的震撼力”。

布拉特用大数据分析文学作品的做法并不止用于分析小说的开篇,他还分析了小说的结尾,经典作家的伟大作品的创作都较少地使用副词,男女作家分别最喜欢什么词汇,写作中的陈词滥调到底有没有用等等,这些文章最后集结成了一本书叫《纳博科夫最喜欢的词》。说实话,这本书读完我还是有点糊涂,因为不知道用大数据对文学作品进行这样的分析,到底有什么用。比如我们知道了很多好的作品都有一个简洁的开头,比较让人印象深刻,如果写作者都听信了这个数据,以后写作都想用一个简短的句子开篇,这种千篇一律的写法难道不是对文学最大的戕害吗?因为好的文学本来如百花齐放,各有不同,如羚羊挂角,无迹可寻,参差不齐才是完美。就算能总结出伟大文学的规律,也不见得按照公式就可以写作出伟大的作品。

用大数据可以统计出文学写作的规律吗


大数据时代的文学生态,逐渐展现出耐人寻味的东西。比如很多人都觉得可以通过大数据的分析总结出文学创作的方法。依照这种方法创作出来的文学的确存在,布拉特在《纳博科夫最喜欢的词》中分析了很多畅销书作家,都有这方面的规律。现如今的畅销书,比如推理小说,科幻小说,同人小说,惊悚小说等等,甚至已经不存在单一作者了,尤其是那些全球畅销书,背后可能是一个团体合作的结果,集体出创意,构思,分章节合作,用一个不存在的作者名统一出版,同样可以博取千万级的销量。但是,实话说,这样根据大数据的规律来创作出来的文学,很难让人觉得是真正的文学,充其量是文学的补充剂,糊弄那些精神空虚的年轻人。

大数据跟文学创作是格格不入的,不要奢望通过大数据的分析来总结出写作的规律,进而创作出像《百年孤独》和《尤利西斯》一样的作品来。在我们这个时代里,大数据对文学的唯一作用就是让我们意识到文学写作是一项任何人和事物都无法替代的独一无二的创造。

相关文章