唐诗现存约5万余首,对于把唐诗作为语料进行研究的价值,蒋绍愚先生在《唐诗语言研究》里是这样说的:“晚唐五代时出现的新词语,其中很多应在初唐就出现了。而初唐到中唐时缺乏像敦煌变文那样典型的集中反映口语词汇的作品,因此,唐诗就成为研究唐代口语词汇的一项重要材料。”又说:“从汉语史的角度来说,它们是当时新出现的词语,是很值得注意的。” 李白诗歌是唐诗的代表,那么,在汉语史的研究中,在唐诗语言研究这个领域里,李白诗歌语言研究毫无疑问应该是重点。而李白诗歌的词汇研究是李白诗歌语言全面展开的基础,因为就某一个作家来说,词汇是该作家语言所使用的材料,是他所用词语的总和,所以研究专人专书的语言应该以词汇研究为重点。
二、《李太白全集》的版本源头是可靠的。其成书年代是确定的。
李白诗歌有一千多篇,因他一生在飘泊中度过,李诗在生前就散失了很多,历经“安史之乱”,他又未能亲自收集成册。好在喜爱李白诗歌的人在帮他搜集,所以,李白去世不久,李白诗文集在海内就流传出三个版本:
第一个版本,是《草堂集》十卷。李阳冰在《草堂集序》文后,明确标明写《序》的时间是:“宝应元年十一月乙酉。”唐代宗宝应元年,即公元762年。可见,李白的族叔李阳冰《草堂集》十卷,在李白去世不久,很快就付梓了。《草堂集》十卷,成为李集中最早的一个版本。
第二个版本,即魏颢《李翰林集》二十卷。天宝十三载(公元754年)李白与友人魏颢相见于金陵,“因尽出其文,命颢为集。……解携明年,四海大盗,……经离乱,白章句荡尽,上元末(公元761年),颢于绛偶然得之,沉吟累年,一字不下。……白未绝笔,吾其再刊。”(魏颢《李翰林集序》) 魏颢既言“白未绝笔,吾其再刊”,可见《李翰林集》二十卷在李白仙逝不久也面世了。魏颢《李翰林集》二十卷,成为李集的第二个版本。
第三个版本,为范传正别收十卷而凑成二十卷。范传正于元和十二年写的《唐左拾遗翰林学士李公新墓碑并序》中说:李白“文集二十卷,或得之于时之文士,或得之于宗族,编辑断简,以行于代”。唐宪宗元和十二年,即公元817年。由此可知范传正所录李白文集二十卷当在此时。这个版本称为《草堂集》二十卷,成为《旧唐书》与《新唐书》著录本的原本。
第四个版本,即唐代流传到日本的《李白歌行集》三卷。李白诗文集,除境内流传的这三个版本之外,唐时海外流传一种,即《李白歌行集》三卷,见《古逸丛书》影印钞本《日本国见在书目》。这一海外流传的版本,詹锳按曰:“《书目》作者藤原佐世卒于醍湖天皇昌泰元年,相当于唐昭宗光化元年(八九八),日本所传可能是中晚唐旧本,原书已经不存。”
以上四个版本就是后世《李白集》流传的源头。李白全集在这四个版本的流传过程中,流传出宋蜀本《李太白文集》三十卷。今所见宋蜀本系由北宋宋敏求所编,清缪曰芑重刻。此本胜于其他版本。而宋蜀本迄今能够见到的最早的一个完整版本是日本静嘉堂文库所藏《李太白文集》三十卷。日人平冈武夫将它影印发行,取名为《李白の作品》,京都大学人文科学研究所1985年出版。
《李太白全集》的成书年代是可以确定在有唐一代的,国内有三个可靠的版本作源头,迄今又能找到日本所藏最好最完整的宋蜀本《李太白文集》三十卷,我们当然有条件完成好李白诗歌语言的研究。只是李白生前未形成文集,多源头的版本流传过程中产生出不少的异文,给李白诗歌语言研究增加了难度,但这是研究中必须攻克的难关。
三、李白诗歌内容涉及面广,词汇容量大。
对专书进行研究,就要求该专书内容涉及面广,词汇容量大。这二者必须成正比例。因为如果一部专书的内容涉及面狭窄,其词汇容量必然不大。即使文字数量可观,也只是局限于狭窄范围内词语的重复使用;如果这部专书内容涉及面广泛,就会使用到方方面面的词语。李白诗歌上1000首,由于诗人宏大广阔的思想情怀,复杂坎坷的人生经历,所以,李白的诗歌上达宇宙辽阔,真人神灵;下及人间沧桑,田园风光。说古,他的诗歌内容上及儒家文化、道家思想、游侠风骨、历史人物;谈今,他的诗歌内容涉及到唐代社会政治、军事、思想、宗教信仰、绘画艺术、天文地理、动物植物、宫廷内外、边戍风尘、百姓疾苦、市井红粉、樵牧渔商等各个方面。他既反对穷兵黩武,更歌唱祖国的壮丽河山;他虽怀才不遇、及时行乐,却抒发“天生我材必有用”之豪情;他虽有干谒之笔、翰林供奉之作,但更有歌颂人间诚挚友情爱情之诗篇。李白的诗歌内容真是丰富多彩!李白诗歌的词汇容量大大超过了同时代的诗人。譬如,李白诗歌大量用典,李白诗文涉及的历史人物据裴斐统计(唐代人物不计)达到了158位(而杜甫诗歌中出现的历史人物为117位)。涉及历史人物多,大量地用典,导致词汇容量极大!本书将李白诗歌进行词语分割、词条统计,得到李白诗歌中复合词的总数是14 563个。
可见,李白诗歌的语言是充分体现唐代口语和书面语特点的重要语料。
四 选用的版本与语料的取舍
一、 选用的版本
本书选用詹锳主编《李白全集校注汇释集评》(以下简称《集评》或詹本)作为工作底本,其理由是:后出转精,成果最新。具体地说,有以下几点:
第一、詹本使用的工作底本是迄今海内外最好的版本,又用各种版本进行校勘。以詹锳领衔的古籍整理小组,1977年接受整理《李白全集》的国家项目后,便多方分头搜求各种海内外传本,最后选定日本平冈武夫影印静嘉堂文库所藏宋蜀本《李太白文集》三十卷为底本,又采用了其他十六种版本进行校勘。尽量保留李白诗文的原貌 ,为我们进行研究提供了可靠的保证。詹锳主编的《集评》参校版本也多,为我们弄懂李白诗文的意思提供了很好的参考。
第二、詹本注释超越了王琦注本。
(1)詹锳主编的《集评》比王琦注本完整。
(2)王琦注本与萧本一样将李白诗歌在流传中产生的“一作”删去了不少,而宋蜀本在诗中夹注的“一作”很多,詹锳主编的《集评》保留了宋蜀本的“一作”,为研究李白诗歌的词汇提供了宝贵的异文资料,具有对比研究的价值。
(3)詹锳主编的《集评》慎重地检对了前人注释。詹本对王注以及杨、萧注引用古诗文的地方做了慎重的检对并注出篇名。这对我们考察李白诗歌的词语有一定的溯源价值,能帮助我们确定语词在语境中的义项。
另外,詹本对李白诗歌中所涉及到的佛、道二教典故,据王注进一步核对。这对我们理解李白诗歌中有关佛、道二教典故的词语有相当的帮助。
第三、詹本增加的五个项目里,其中题解、校记、分段与串讲和集评这四项,还有书前所附的《前言·李白诗中的爱国主义情操》,对理解李白诗文有提示作用。
第四、詹本书后所附的《〈李白集〉版本源流考》,为我们寻找李集的其他重要版本提供了线索。
第五、詹本前三十卷以宋蜀本《李太白文集》三十卷编次李白诗文,编写体例清楚,便于查找。全书分八册,共三十卷。第一卷至第二十四卷为李白的诗歌,按古风、乐府、歌吟、赠、寄、别、送、酬答、游宴、登览、行役、怀古、闲适、怀思、感遇、咏物、题咏、杂咏、闺情、哀伤这二十类来编次,共计1001首;后六卷为李白的文,也按类编排,总计67篇。
第六、詹本在第八册还收有《李太白全集》以外的诗文62篇(包括王本42篇、《校注》9篇、《全唐诗续拾遗》11篇),这些集外诗文对我们全面研究李白诗歌的词汇是具有参考价值的。
詹锳主编的《李白全集校注汇释集评》出版后,得到了学术界的肯定,学者们公认它是迄今为止整理得最好的版本,所以,本书把它选定为工作底本。
二、语料的取舍
首先说明,本书将李白诗歌995首视为直接的语料来源。
本书就是以詹本正卷所载李白诗歌,作为语料来收集李白诗歌并列式复合词的。詹本正卷收李白诗歌从宋蜀本,所收诗歌有1001首。詹锳《〈李白集〉版本源流考》介绍宋蜀本时说:
宋蜀本《李太白文集》收诗九百九十八篇,加上魏万(即魏颢)、崔宗之、崔成甫唱和诗各一首,正好是千有一篇。
但据李白研究成果中“李诗之辨伪”可知:李诗辨伪始于北宋苏轼,20世纪的李诗辨伪更为科学,主要有詹锳《李诗辨伪》,郁贤皓、尹楚彬《李白诗的辑佚与辨伪》等。经过古今学者的考辨,现可确定为他人之作而误入李集的有:岑参的《送别》(“斗酒渭城边”),王昌龄的《军行》(“骝马新跨白玉鞍”),顾况的《去妇词》(“古来有弃妇”),高适的《观放白鹰》(“寒冬十二月”),玄宗的《谒老君庙》(“先君怀圣德”),晚唐人的《送贺监归四明应制》(“久辞荣禄遂初衣”)等,共计6首。因为这6首都是唐代诗人的诗歌,詹本保持宋蜀本原貌仍收在李集正卷中,所以,李白诗歌中的并列式复合词如在这六首诗里有用例,本书则把它们作为李诗词语的参照而收集进来,但诗题后加括号标明诗的作者。
这样一来,詹本正卷所收的李白诗歌1001首,除去以上6首,还有995首,
所以,本书以李白诗歌995首作为直接的语料进行收词。