计量语言学

其他

商务印书馆与我的语言学之路

小编按:本文是刘海涛教授为庆祝商务印书馆建馆125周年而作,载《商务印书馆一百二十五年(1897-2022):我与商务印书馆》,第733-739页。文章初始以微信推文形式写成,包含部分图片和链接,纸本出版时做了删节。本次推送为原稿全文,以飨读者,红色字体为删节部分。在当代中国,只要上过学的人,可能都与商务印书馆有或多或少的关系,也许他们已不记得“商务印书馆”这个名字,但一定不会忘了《新华字典》对他们的帮助。作为一个从事语言学教研的人,我与商务的联系当然不止是一本《新华字典》。40年前,我还是一名在读的工科生,开始对外语学习和语言研究产生了浓厚的兴趣,于是读了很多商务出的书,比如在1898年出版的商务第一本学术专著《马氏文通》。从某种意义上讲,是商务开启了我的“语智”(语言研究的智能),我是商务“昌明教育、开启民智”宗旨的受益者。我的语言学之路是从研习世界语开始的。据不完全统计,商务建馆125年来,出过的与世界语的相关图书有:《世界语高等新读本》(1922)、《世界语高等文典》(1922)、《世界语初级读本》(1923)、《国际语运动》(1925)、《世界语概论》(1926)、《世界语史》(1930)、《万国语通论》(1933)、《世界语初级讲座》(1958)、《世界语新词典》(1959)、《注释世界语文选》(第一辑,1959)、《世界语学概论》(1992)、《世界共通语史》(1999)。我在这里列出这些,是想说明即便这么小众的领域,商务出的书也涵盖了它的方方面面,既有理论,也有历史,还有教材和词典,这是非常不容易的。在写这段文字的时候,我旁边摆着1982年11月8日买的《世界语新词典》,那是我的第一本世界语词典,就是这本词典和《世界语初级讲座》把我带进了世界语的世界,并在2016年当选为只有40位成员的国际世界语研究院的院士。说到世界语,我们不得不提及胡愈之先生。1931年,愈之先生从欧洲途经苏联回国,在当地世界语者的帮助下,他在莫斯科参观访问了一个星期,回国后写了《莫斯科印象记》,风靡一时。在这本书的扉页,他用世界语写道:Al
2022年6月25日
其他

数智时代语言研究的挑战与机遇

小编按:数智时代的语言研究如何在守正的基础上坚持创新?《中国社会科学报》今日刊发刘海涛教授的文章“数智时代语言研究的挑战与机遇”,对这一问题做了简要评论和反思。人类正步入智能时代,很难想象智能可以脱离语言而存在,这也许是人类历史上最需要语言学家的时代,遗憾的是现实世界的主流语言学却似乎与这个时代渐行渐远。为什么会这样?形成这一挑战的主要原因可能在于,智能时代的推动力源于数据。换言之,我们正在进入数智时代,但对于大多数语言学家来说,基于数据驱动的语言研究方法则是陌生的、困难的。为了应对数智时代带来的各种挑战,语言学家们需要进行全方位的反思,特别是从目标、方法、语料和知识表征等方面进行反思。
2022年5月17日
其他

国家安全视域下的语言问题(观点摘要)

小编按:近年来,随着总体国家安全观的提出,国家安全问题日益彰显其重要性。语言作为一种“软件”,在维护和保障国家安全方面发挥了一定的作用,语言安全问题也逐渐受到学界的关注。《中国外语》第6期刊发的文章《国家安全视域下的语言问题》,就是旨在从国家安全的角度探讨与语言安全相关的诸多问题。文章经“高教社外语”微信公众号推送后,在短时间内获得了大量的点击阅读。有学者认为,该文是“叙事性与学理性、思想启迪性与现实建设性、话语事实与逻辑事实相互对照的典范之作。”考虑到文章篇幅较长,我们经作者授权摘取了文章的重要观点在本号推送,以飨读者。人是构成国家的要素之一,而人不仅是社会人、经济人,更是语言人。《国安法》第三条明确指出,国家安全工作的宗旨是人民安全,保障是军事、文化、社会安全。尽管没有提及语言,但鉴于文化与语言的密切关系,我们有理由认为语言安全也是国家安全的要素之一。
2021年12月19日
其他

花格老刘的2021

明年,我就到法定退休年龄了。因此,有必要唠叨唠叨今年的事。作为大学教师,做的工作不外乎与教学科研有关。教学就不多说了,每年选课的同学还是不少的,教室也基本都满了,教学材料也与时俱进,上课也很卖力在讲。毕业了几个博士生,其中,王雅琴的博士论文获得了浙江省和浙江大学的优秀博士论文,这也是我在过去五年里第二次获得省优博指导教师的荣誉。今年发表的科学研究成果有点特色,下面的小结主要围绕这个来说。数量上,我们发了23篇论文,其中:外文12篇,中文11篇。具体的文章信息在我的个人主页有,感兴趣的可以去这里看看https://person.zju.edu.cn/lht。下面我们挑几篇唠叨唠叨。每个学科都有神刊,语言学也不例外。今天,很多语言学家心目中的神刊可能是Language,但对我来说,是《语言学问题》(Вопросы
2021年12月12日
其他

欧洲联盟语言状况及语言政策

小编按:近年来,语言治理(尤其是全球语言治理)成为语言政策及规划领域的热门研究。从某种意义上来说,全球语言治理是一种超越国家层面的语言政策研究,其对象就是通常所说的超国家组织。欧盟是当前超国家组织的典型代表。今天推送的文章是《欧洲联盟语言状况与语言政策》,原文刊载于《中国语言生活状况报告(2005)》(商务印书馆,2006)。文章基于相关数据和文献资料,讨论、分析了欧盟的语言状况及语言政策,在国内比较早地意识到超国家组织语言政策的重要性。欧盟的语言问题“看似简单、实则复杂”,语言政策的制定要考虑到多重因素的影响,如“社会语言现实、策略实施的成本、遵循的基本原则、可操作性和效率、政治因素”等等。因此,文章虽然发表于十几年前,但对当下全球语言治理的研究仍然具有一定的参考价值。一、语言状况欧洲联盟是一个超国家的组织,既有国际组织的属性,又有联邦的特征。目前欧盟的成员国有:法国、德国、意大利、比利时、荷兰、卢森堡、丹麦、爱尔兰、英国、希腊、西班牙、葡萄牙、奥地利、芬兰、瑞典、塞浦路斯、捷克、爱沙尼亚、匈牙利、拉脱维亚、立陶宛、马耳他、波兰、斯洛伐克、斯洛文尼亚,共25个国家。欧洲理事会(European
2021年7月16日
其他

语言国际化的要素可以量化吗?

世界是多语的。据“世界语言大全”(Ethnologue)最新统计,目前世界范围内共有7139种语言,它们的分布大概是这样的:
2021年7月8日
其他

数据驱动的应用语言学研究

2019b)以依存方向作为类型学指标,分析了不同水平的中国英语学习者的语言,从语言类型学的角度揭示了过渡语不断趋向目标语的过程,也用真实的学习者语言材料证实过渡语确实存在此前提及的那些概率性特质。
2021年4月16日
其他

不同水平的学习者二语句法习得规律一样吗?

在二语研究中,提起“错误”,我们肯定绕不过Corder在1967年发表的The
2021年3月30日
其他

繁体字文本真的比简体字文本更复杂吗?

陳寅恪先生曾在1965年給中華書局編輯的信中強調,“請不要用簡體字”出版他的著作。你有没有注意到,前面这句话里有一些繁体字。但是,你看懂了,有没有?虽然可能与小编一样,并不能完全正确地书写“簡體”二字。(图片来自百度搜索)简化汉字是新中国成立后实施的三项重要的语言规划活动之一。但是,字形简化并不是新生事物。从汉字演化的历史看,自楷书定型以来字形结构一直在简化,简化字与正体字长久并存。那么,人们为什么要简化字形、使用简体字呢?因为简单。怎么就简单了呢?汉字是记录汉语的符号,笔画-部件-汉字,是汉字构形的三个层级。汉字笔画的多少可以看作一种衡量字形结构“简单”与否的手段。采用这种手段,可以比较繁体字与简体字的字形复杂程度。下图是2000个常用汉字简化前后的笔画数分布。汉字简化前后,都是既有笔画少(简单)的字,也有笔画多(复杂)的字。汉字简化使笔画少的字增加了,笔画多的字减少了,笔画数分布曲线的形态基本保持不变,整体向左移动了。从平均意义上看,简体字比繁体字笔画少,书写起来更省力。但是,无论是今天的报纸,还是两千多年来的书籍,汉字记录的文本中,既有结构复杂的字,也有结构简单的字,古籍中并不都是复杂汉字,微博上也并不都是简单汉字。那么,整体上,使用繁体字的文本比使用简体字的文本更复杂吗?以往汉字简化研究大多关注具体字形结构与构形系统的局部细节,对构形系统整体规律在汉字简化过程中的特点,特别是在汉字使用中的表现,关注得不够。造成这种结果的原因,除了研究问题与视角不同外,也有研究方法与手段的不足。上述问题的答案需要采用适当的方法到文本中去寻找。最近发表在《语言文字应用》上的《汉字简化中的字形复杂度统计特征稳定性研究》一文,报告了基于计量语言学方法研究汉字构形系统整体规律在汉字简化前后的一些统计分析结果。
2021年3月30日
其他

二语者与母语者的动词配价发展规律一样吗?

中小学语文课上老师常常会让我们赏析名言名句,句中所含的动词往往是分析的重点之一。大家还记得“僧敲月下门”“帘卷西风”“悠然见南山”中“敲”“卷”“见”的妙用吗?小编真的是感叹诗人们高超的语言运用能力!心里就只有一个词,“妙”!用现在的流行语就是:我直接好家伙!先贤们很早就注意到了动词的重要地位,使用好动词能更加深刻地表现出作品所蕴含的意境和闪现的动感。欧洲学者同样有一句话能够体现动词的重要作用:“动词,如同在黑暗中开启的一盏明灯,照亮了一片天地”。泰尼埃(Tesnière)曾把动词比作太阳系里的太阳,动词的外围分布着其他句法成分,就像行星围着太阳一样(这个说法还真是浪漫呢)。我国也有学者指出动词的重要性,比如吕叔湘提出“动词中心说”,指出叙事句是由一个作为“中心”的动词和围绕着它的若干“补语”组成的。泰尼埃不仅仅善于比喻,他还是现代配价理论的奠基人,而动词正是配价理论的核心。“价”这一概念想必大家都不陌生,它借自化学中的概念“化合价”。应用于语言学中,“价”是指动词与其他句子成分组合的一种能力。我们可以把动词看成为一个“钩子”,在真实语境中,根据动词所能勾住的体词数量,可以把动词分为零价动词、一价动词、二价动词和三价动词(其实这也是泰尼埃的比喻,他也是位语言运用大师)。在传统配价理论的基础上,学者们基于计量视角提出了广义配价理论。该理论认为,动词具有和其他词结合形成更大语言单位的潜在能力,动词配价分析涉及到的应该不仅仅是其论元,还应该包括其所有的补足语和说明语。一个动词的广义配价就体现为通过依存关系与其他词结合的能力,其潜在的配价通过依存关系得以在具体句子中实现,可以说依存关系是动词配价实现的结果。动词和名词是儿童最先习得的词类成分。有研究表明,在英语等语言中,名词是儿童最初词汇中最主要的种类,动词是第二大词类。但是,汉语儿童在3岁以前却习得了大量动词,仅表现出微弱的“名词优势”。然而,不管是印欧语系语言还是汉语,学者们达成了一个共识——在儿童早期句法发展中,动词发挥了重要作用,即它搭起了句子的基本框架。李辉、刘海涛(2019)对汉语儿童早期动词配价的研究发现,随着年龄的增长,儿童语言中动词作为支配词与从属词所形成的依存关系的比率和种类逐渐增加,动词作为支配词的结合力不断增强。也就是说,随着儿童认知与抽象思维能力的发展,动词所能支配的句法结构越来越多了。此刻,我们不由得想到洛克的“白板说”。洛克认为人类心灵的原始状态是一块白板,一切知识和观念都是后来从经验中获得的。儿童在习得母语时大脑中不会有其他语言对其干扰,但是成年的二语者呢?成年二语者已经具备了系统的母语知识。在第二语言习得中,母语与目的语在语言类型之间的差异会影响中介语的发展,也就是我们熟知的母语迁移现象。那么,二语者很可能会呈现出与儿童母语者不同的习得规律。具体会是什么规律呢?存在差异的同时,汉语动词配价发展是否也存在共通规律呢?发表于《语言文字应用》2021年第1期的《基于句法标注语料库的汉语中介语动词配价发展计量研究》一文,对这些问题进行了探讨。项研究计算了不同汉语水平学习者的语言产出中,动词作为支配词时的依存关系比率(即动词作为支配词时所支配的某依存关系频数与动词频数的比值),得到了下面汉语二语者的数据表,并与汉语儿童母语者的发展情况进行了对比(诶呦,数据有点意思哦!)。研究发现了一些有趣的现象,二语者和儿童母语者的动词配价存在许多不同之处。在依存关系种类上,二语习得者在学习汉语的初始阶段就能与目的语接近,到2年级时就与目的语一致了,并且在之后的学习时间里(2~4年级)一直保持稳定,说明二语学习者动词的支配能力习得全面并趋于稳定。与汉语儿童母语者相比,二语者动词支配的依存关系种类发展更快、更为丰富。在依存关系总比率上,二语者也高于汉语儿童。经相关分析发现,整个发展过程中,汉语二语者的依存关系比率总和随汉语水平的提升而显著升高,从1年级(G1)的262.38%上升到4年级(4年级)的320.21%,但是12~42个月的汉语儿童仅从100.1%上升到236.1%。不管是在初始阶段还是习得的最终阶段,汉语二语者都高于汉语儿童母语者。就依存关系的发展趋势来看,二语者呈阶梯式发展:G1~G2阶段发展缓慢,G2~G3阶段发展迅速,G3~G4阶段发展速度又有所减缓。这与汉语儿童习得母语整体呈直线上升的发展趋势又有很大的不同。在认知复杂度较高的依存关系比率方面,二语学习者均高于汉语儿童。例如状语、复句关系、时态附加语等说明语,在说明语总体比率数值上二语者为139.03%,但汉语儿童仅有87.7%。但是,汉语儿童的主语、宾语、状语等主要依存关系比率变化幅度大于汉语二语者。例如,汉语儿童的主语增长幅度接近50%,状语增长幅度为20%左右。这些规律背后的原因是什么呢?作者认为,与儿童习得母语不同,成年二语学习者拥有成熟的母语系统和认知系统,母语经验会对其二语习得过程产生影响,学习者原有的母语知识对其习得起到了促进作用。从语言类型上看,英语与汉语同为SVO型语言,两种语言有很多共性。从微观上看,汉语和英语语义内容基本相同的动词具有相似的主要支配能力,例如“见面”与“meet”、“等待”和“wait”都主要支配主语、宾语和状语等。这种相似起到了正迁移的作用。因此,成年英语母语二语者习得汉语动词配价的特点与汉族儿童习得母语不同。在发现不同规律的同时,该研究也发现了二语者与汉语儿童存在一些相同规律。例如,二语者与汉语儿童在各自最高水平上,动词支配补足语的比率与支配说明语的比率差值较大,但是汉语成人母语者(目的语)的差异较小。又如,在重点补足语上,二语者和汉语儿童使用动词支配宾语的比率始终高于动词支配主语的比率,也就是空主语多于空宾语,都存在不对称的现象。动词支配说明语、补足语比率对比图虽然二者存在相同的规律,但是作者认为各自的成因并不相同。汉语儿童由于早期语言加工能力和记忆能力有限,为了减轻加工负担,常常会省掉主语或宾语。二语者存在空主语多于空宾语是因为受母语主语突出特点影响从而产生了负迁移。虽然二语者与汉语儿童整体上支配补足语与支配说明语比率都不均衡,但是前者更多是受到母语的影响,后者则更多受制于认知水平。小编觉得这些发现好神奇啊!不同的规律背后是相同的成因,而相同的规律背后却是不同的原因。作者是如何从纷繁复杂的语言现象中抽丝剥茧得到这些结论的,详细的情况请通过“阅读原文”下载全文吧!明天,小编将为大家介绍《中国英语学习者写作中的错误、依存距离与二语水平的关系研究》这篇论文。欢迎持续关注哟!
2021年3月30日
其他

数据驱动的语言应用研究

最新一期的《语言文字应用》(2021年第1期)刊登了一组数据驱动的语言文字应用研究论文。本号从今日起,将连续四天为大家做一些推荐,欢迎关注。今天小编给大家带来的是刘海涛教授为这组论文撰写的导言《数据驱动的语言应用研究》。全文如下:周有光先生在《语言文字应用》的首期首篇文章中认为,应用语言学最主要和最紧迫的研究有三个方面:语言教学、语言计划、信息处理。时至今日,语言信息处理在人类语言大数据的加持下,已经取得了长足的进步。值得注意的是,在赋予计算机语言智能的过程中,语言学家所起的作用微不足道。为什么最懂语言的语言学家在这个最需要语言学家的智能时代,却被无情地抛弃了?为什么语言学家发现的那么多的语言规律没有派上用场?是寻找规律的方法有问题,还是这些“语言规律”本身反映的并不是人类语言的规律或人类语言系统最本质的规律?在这种情况下,应用语言学研究者,可能需要自已探求基于应用的语言规律,此时可从语言信息处理同行们的成功中得到启发:语言规律源于语言使用。在语言教学方面,一个显见的事实是,不同水平的学习者产出的语言是不一样的。尽管可以采用各种现代的实验方法来研究学习者的心理、神经等认知机制,但对语言学家而言,从真实的学习者语言数据中发现语言学习的规律,并使用这些规律改进语言教学的过程,可能是一种永不过时的可靠方法。在《语言文字应用》的首期中,我们看到吕必松、鲁健骥等人有关语言教学的文章。由于受时代因素的限制,这些文章大多采用了思辨或举例的方法,但文中的许多思考至今仍有现实意义。如,吕必松说“没有对语言的规律和规则的描写,语言教学就寸步难行。”鲁健骥则认为,偏误分析旨在发现外语学习者发生偏误的规律,可使外语教学更有效、更有针对性。这说明,《语言文字应用》从创刊之日起,就非常关注语言规律对于语言教学的作用,关注应用语言学与语言规律之间的关系。29年过去了,人类已经进入一个由大数据催生的智能时代,技术的发展,数据驱动语言学研究方法的进步,使得我们有了从大量学习者真实语料中发现规律的可能,也就有了本专题中有关学习者语言的两篇研究。学习者语言是一种过渡语。这就要求研究者采用同一种测度指标对不同水平学习者的语言数据进行统计分析,必要时也需要与母语者的语言数据进行比较,否则,我们很难发现中介语所具有的过渡性、渐进性、连续性、动态性等特点。本专题的两篇文章均采用了句法标注的学习者语料作为研究资源,但研究的对象与视角不同。基于词间依存句法关系分析人类语言真实语料的方法,已在自然语言处理领域得到了广泛应用,并正成为基于数据的学习者语言研究的主要句法模型。动词在基于配价的依存分析架构中占有核心的地位。如果将配价理解为词语的结合能力,那么研究学习者动词配价的发展规律就显得尤为重要了。郝瑜鑫等采用“概率配价模式”,对英语母语的汉语学习者的动词配价发展进行了研究,结果发现学习者动词配价发展是一个连续、渐进与多因素并存的过程。严格说来,尽管“概率配价“使我们有了从动态的语料中获得和研究词语配价的可能,但配价本身是词的一种静态特征,它所蕴含的结合能力也是一种潜在能力。这种潜在能力只能在词语的具体使用中显现出来。实现了的配价便形成了句法关系。人类语言是一种人驱的复杂适应系统。这里的人驱有两层意思,一是离开了人的使用,语言将不再有生命;二是在语言使用过程中,人的认知机制对于语言结构是有约束的。依存距离指的是两个具有句法关系的词在句子中的线性距离。对数十种语言大规模语料的计量分析表明,由于受人类工作记忆容量的约束,人类语言具有一种依存距离最小的倾向。因此,两个形成句法关系的词在句子中离得越远,就越难理解或越难生成。蒋景阳、姜茜茜的文章,采用依存距离作为计量指标,以汉语母语的英语学习者为对象,考察了学习者错误、依存距离与二语水平之间的关系。她们的研究表明,对于相同的长距离依存关系,中低水平与高水平学习者的处理策略与能力是不一样的,展现了语言学习过程的复杂性和多样性。这两项基于英汉、汉英的学习者句法标注语料库的研究,在语言加工和产出之间建立了科学可信的证据链,为语言习得提供了一种符合数据+智能时代精神的研究思路。语言计划,今天一般称之为语言规划,是周有光先生提及的应用语言学的另一个重要领域。汉字的规范化与简化历来是中国语言规划的主要内容之一。在《语言文字应用》的头三期中,我们也发现了多篇有关汉字(简化)的文章。在有关汉字的语言规划讨论中,繁简之争似乎是一个永远也难有结论的话题。尽管从理论上讲,文字只是记录语言的符号,但历史的长河为语言与文字的关系带来了太多难以分离的水滴。语言规划是一种顺势而为的活动,这里的“势”指的是语言文字的结构与演化规律。众多实践表明,顺势的规划更容易取得成功。索绪尔说,“语言是一个系统,它的任何部分都可以而且应该从它们共时的连带关系方面去加以考虑。”汉字是汉语书面语的基本组成单位。因此,为了更客观地判断汉字简化对于汉语结构的影响,我们可能需要从真实的汉字流中发现汉语书面语的结构规律。黄伟以计量语言学中研究线性规律的动链为指标,基于数百篇繁体字与简体字的文本,研究了两类字体文本的结构特征。他的研究表明,字形简化没有改变汉字构形系统与动态使用中的分布规律,也没有改变字形线性组合模式的频次与长度分布规律。这说明,现有的汉字简化并没有打破汉语书面语结构的线性规律,是一种顺势而为的语言规划活动。这里的三篇论文只是数据驱动语言文字应用研究的初步尝试,还存在着一些不足,但可以肯定的是,基于语言使用数据的应用语言学研究更客观地反映了语言使用的现实,更密切地关注了“概率性”这一人类语言的本质属性,因此,也就有可能更好地回答应用语言学研究者关切的问题。今天的推送就到这里了。想要获取全文,请戳“阅读原文”。明天将给大家介绍第一篇论文《基于句法标注语料库的汉语中介语动词配价发展计量研究》。欢迎关注哟周末愉快!
2021年3月26日
其他

德语书面语破框现象是特例吗?

小编按今天小编要给大家介绍的这篇文章出自《现代外语》2021年第3期。正如篇名“德语书面语破框现象是特例吗?”,作者李媛、黄含笑、刘海涛探讨了德语特有的语言现象——破框,并通过语料库检索得出了十分有趣的结论。浙江大学的刘海涛老师团队近年来基于依存理论和大规模真实语料,致力于探索跨语言普遍现象。在“花格老刘”的带领下,团队在对数十种语言进行跨语言普遍规律探索的同时,近期又在德语语言研究领域开花结果,目前已有两篇文章发表在《计量语言学学报》和《浙江大学学报》上,分别为“Word
2021年2月24日
其他

浙大十年

鉴于我本人在相关领域做出的贡献,多种国际会议、权威刊物与丛书邀请我担任(联合)主编、副主编、编委会以及程序委员会成员,这些都是一个正常的学者应该做的,不值得大说特说。
2020年9月24日
自由知乎 自由微博
其他

书讯 | 《依存语法的理论与实践》典藏版上市!

2018年,小编在准备推文《依存结构的计量分析》时,曾提及被坊间称之为“蓝皮书”的《依存语法的理论与实践》。当时,主要想表明“蓝皮书”对《依存结构》一书的影响,以及两本书之间存在的学术渊源和联系(具体可参看“书讯
2020年3月10日
其他

书讯 | 计量语言学研究进展

首先呢,这是一本以汉语为主要研究对象的论文集。与前一篇推文介绍的徳古意特出版社出版的Quantitative
2018年11月9日
其他

书讯 | Quantitative Analysis of Dependency Structures

Köhler教授。需要指出的是,全书作者以中国学者为主,这体现了中国在依存语法及计量语言学研究方面已经与国际接轨并达到世界领先水平。为了方便阅读,小编也特意从出版社官网下载了目录,以飨读者。
2018年10月16日
其他

大数据时代语言研究的方法与趋向

然而,正是在这一颇具发展潜力的语言应用领域中,却时而能听到对于语言学家的质疑声。例如,美国工程院院士、自然语言处理专家弗雷德里•杰利内克(Fred
2018年5月24日
其他

干货 | 《计量语言学研究进展》前言节选

计量语言学是以真实语料为基础、用精确的方法来研究语言结构与发展规律的语言学分支学科。这一句话概括了计量语言学研究的三个主要特征:精确、真实、动态。自2011年底我们承担的国家社科基金重大项目《现代汉语计量语言学研究》(11&ZD188)立项以来,课题组全体成员同心协力,以现代汉语为主要研究对象,取得了一些有趣的成果,并于2017年1月初顺利结项(2017&J004)。至2016年底结项时,课题组已在国内外公开发表带有基金批准号的论文80篇。这些论文被以下检索系统收录:SSCI
2018年4月16日
其他

我的世界语研究之路

Ojalo多年的通信,1991年初,我终于在第一时间收到了这本期待已久的著作。在此期间,Ojalo先生给我寄来了许多俄语的国际语学文献[3],如著名的Interlinguistica
2017年12月28日
其他

票圈儿花样晒书集锦

在刚刚过去的一周票圈儿发生了一件小事儿《计量语言学导论》在上市后的三天之内就获得如下销售佳绩考虑到很多朋友是从京东、天猫等渠道购买的亚马逊的销量可能不能完全说明问题虽然有不少朋友说买不到但是从上周二开始也有很多朋友先后拿到了这本期待已久的新书紧接着票圈儿晒书活动就开始了……看得小编们(对,是复数,“我不是一个人”)开启“晒”书模式……据说最先拿到书的是北京地区和长三角地区的朋友们四非高校的同学是要开始做笔记了么?这校名怎么会是全中国最水的大学呢?复旦大学这个如何简称?与MIT比肩的NIT浙江财经大学,财务一支笔的意思么?晒书怎么少得了图书馆Run-run
2017年10月30日
其他

上市第一天就多次被抢光!现已补货,你买到了吗?

被大家的热情感动,小编下了飞机到达驻地赶紧收集了一下目前的最新情况。现在可以通过以下三个渠道购买:1.
2017年10月23日
其他

讲座预告 | “木匠”与“照相的”联袂演出

主讲人:刘海涛浙江大学求是特聘教授、博士生导师;广东外语外贸大学云山领军学者;宁波理工学院9211学科领航讲座教授;国际世界语学院院士(Akademio
2017年10月17日
其他

“木匠”加盟东方剑桥,“照相的”送上神秘礼物

IQLA),担任了多届会长;创办了计量语言学专业期刊《计量语言学学报》(Journal
2017年10月14日
其他

讲座 | Köhler:文本中重复现象的计量研究

还记得小编在《JQL主编Köhler教授序全文》里说过“国内学者今秋将有幸现场聆听科勒教授的报告”吗?秋天来得很快(昨天友人还问小编穿短袖冷不冷,今天小编就已经看到有人穿羽绒服了),福利也随之而来。本周五,科勒教授将在浙江大学紫金港校区讲述计量语言学视角下的语言重复现象及其研究方法。讲座将在对重复现象进行观察与分类的基础上,分析它们在文本中的功能,介绍适用于分析这些重复现象的研究手段。详细信息如下:题目:文本中重复现象的计量研究主讲人:Reinhard
2017年10月9日
其他

会讯|QUALICO 2018将于明年7月在波兰召开

2018将于明年7月5-8日在波兰弗罗茨瓦夫(Wrocław)召开。QUALICO是由国际计量语言学协会(International
2017年10月4日
其他

一位被计量语言学耽误了的摄影师如是说

前天和昨天分别分享了阿尔特曼和科勒两位教授为《计量语言学导论》撰写的序言。坊间流传,阿尔特曼是一位被计量语言学耽误了的段子手,科勒是一位被计量语言学耽误了的木匠,刘海涛是一位被计量语言学耽误了的摄影师。(计量语言学家到底有多热爱生活?!)段子、木工活儿、摄影作品,容小编改日呈上。今天,我们来听这位被耽误了的摄影师讲述《计量语言学导论》的故事。计量语言学以真实语言活动中产生的言语材料为研究对象,力求通过定量方法来探索语言的结构模式与演化规律,是一个用精确的方法来研究人类语言的语言学分支学科。“精确、真实、动态”是计量语言学研究的三大特点。计量语言学的这些特质使其表面看来与传统语言学的研究方法有些格格不入,不少语言研究者一听到“量化”“数学”等词语,就退避三舍,或扭头而去。然而,这样的逃避与远离可能并非长久之计。许多研究证明,人类的语言系统是一个动态复杂适应系统。而对于各种复杂系统的研究,自第二次世界大战以后,人们已经取得了丰硕的成果,随着计算技术的发展,也出现了许多研究复杂系统的软件工具。在这种情况下,语言研究者可能需要转换观念,与时俱进,在继承传统研究方法的基础上,结合系统科学的一般理论与方法,尝试用一些具有信息时代、大数据时代特征的方法来探索人类语言系统的规律。许多年前,有语言学家说“语言学是一门领先科学”,但在真正的科学家眼里,语言学家所说的“科学”是加引号的,只是语言学家们自己的一种说法而已。因为,对于什么是科学这个问题,科学家是有共识的,科学哲学对此也有详细的论述。一门学科是否科学,主要看其采用什么样的研究方法。大卫·艾丁顿认为,能否有效地解释现实世界语言现象的关键在于科学方法的使用,语言学的进步取决于研究者是否采用了通行的科学研究方法。我们同意艾丁顿的这一说法。换言之,语言学的科学化不能只停留在口头,科学化需要研究者掌握科学的研究方法。2011年,我们有幸中标首批跨学科国家社科基金重大项目“现代汉语计量语言学研究”。在撰写投标书的过程中,课题组成员深感急需一本用汉语写成的有关计量语言学的导论性质的著作。这样的著作不仅有助于我们理解计量语言学的历史、理论与方法,也有助于语言研究者消除对量化与数字的恐惧,并且能够利用这种方法进行研究。于是,编写这样一本导论,自然就成了课题组的主要任务之一。课题获批后,大家立即投入工作。原本以为编写这样一本入门书,用半年时间应该可以完成。但我们后来发现,这样的想法过于乐观了。首先遇到的问题是,没有可供借鉴、可作参考的同类书,换言之,我们正在编写世界上第一本计量语言学的导论。尽管此前有德国学者贝斯特用德语编写的一本一百多页的计量语言学著作,但该书一是没有按照一般导论书的历史、理论与方法的写法来写,二是书中举例多用德语,不懂德语的人很难通过这些例子掌握计量语言学的方法。在这种情况下,我们只能从零开始,自力更生。考虑到对于大多数中国的语言学研究者来说,计量语言学是一个全新的领域,我们特意召集了几位文科背景的语言学专业的研究生与青年学者,大家一起讨论:如果他们现在打算开始计量语言学研究,最希望有一本什么样的入门书?经过多次讨论,我们制定出了一个涵盖计量语言学历史、理论与方法的编写提纲。我们认为,要进入一门学科,首先需要对其历史有所了解。计量语言学的历史虽短,但人类关于语言量化研究的历史却并不短。于是,第一章首先从语言量化研究开始,介绍了在现代计量语言学诞生之前的一些主要的人与事,以及现代计量语言学的主要学派——德国的阿尔特曼学派。按照导论书的一般结构,接下来的主题是“理论”。但历史好讲,理论难谈。因为按照科学哲学的观点,理论是由彼此关联的定律和假设所组成的一个系统。换言之,没有定律也就没有真正意义上的理论。好在计量语言学研究的主要目的正是寻求语言结构及其演化的各种定律,这样,定律便成了本书讨论的主要内容之一。为了让读者能够更好地理解“理论”这一章的内容,我们也尽可能用汉语的语料来验证与解释书中所提到的各种语言定律。在一本导论书中,“方法”可能是一般读者最感兴趣的部分。历史是过去,理论是高度,方法是道路。历史再辉煌,理论再高大,如果我们无法脚踏实地前行,一切都是浮云。本着方法决定成败的精神,考虑到计量语言学之所以令人生畏,问题可能就出在方法上。因此,我们在“方法”这一章除了简单介绍计量语言学的一般方法外,将重点放在了几个计量语言学软件的使用上。实践证明,文科研究者只要掌握这几个软件的使用,就可以立即开始自己的语言计量研究了。在这一章里,我们也用一定的篇幅介绍了如何采用复杂网络方法来研究语言,发现语言系统的整体特征。搞清了历史,看懂了理论,掌握了方法,并不意味着就可以做出好的研究。实证研究是以问题为导向的,没有好的研究问题,再好的方法可能也难以产生高质量的成果。考虑到初学者的需要,我们从现有的计量语言学出版物中选取了20多个研究问题,这些问题以及可能的研究步骤形成了本书的“问题”一章。现代计量语言学是一个严格按照科学哲学对于科学的定义构拟的语言学分支学科,我们在介绍这一学科的历史、理论与方法的同时,虽然已努力使本书能够通俗易懂,但现在看来,有些地方可能还不尽如人意。为了让读者更好地了解计量语言学的发展历程、研究对象以及常用的理论与方法,我们采用文献计量学的方法详细分析了《计量语言学学报》二十年来发表的文章,并将其作为本书的最后一章。希望读者可以通过这一章对计量语言学有一个更具体的了解。这本书是国家社科基金重大项目“现代汉语计量语言学研究”课题组成员集体合作的产物。课题首席专家刘海涛作为主编参与了全书的撰写与统稿,各章节初稿编写的分工如下:金慧媛(1.1,1.2),章红新、潘夏星(1.3,1.4),韦爱云、严菁琦(2.1),陈衡、王华(2.2,2.3,3.1),丛进、黄伟(3.2,3.3),陈蕊娜(4,5)。林晓为本书一些章节提供了材料。初稿之后,又十易其稿,形成了现在这个版本。统稿期间,黄伟、韦爱云、张聪做了大量的工作。蒋景阳、梁君英、于水源、胡凤国、徐春山、方昱、王雅琴、张丽丽等审读了手稿,并提出了一些具体修改意见。赵怿怡、林燕妮翻译整理了阿尔特曼与科勒教授为本书所作的序言。在本书编写过程中,德国的阿尔特曼教授与科勒教授给我们发来了大量的计量语言学文献。这两位国际计量语言学的领军学者还特意为本书撰写了序言。可以说,没有他们的帮助与支持,本书很难完成。我们也要感谢冯志伟先生长久以来的支持与帮助。感谢商务印书馆周洪波总编辑决定将本书纳入商务语言学教材系列,感谢王飙编审高质高效的编辑工作。计量语言学研究涉及语言学、数学、统计学、心理学、物理学、系统科学和计算机科学等多个学科领域,是一个典型的文理交叉学科。学科交叉虽然有助于我们更科学地探索人类语言系统的规律,但对于一本入门书的编写者而言,如何将如此繁杂的内容包装在一个不大的百宝箱里,其难度不言而喻。这也可能是世上至今没有一本计量语言学入门书的原因之一。为了达成理论与实践相结合的目标,我们在编写过程中参考使用了许多国内外的文献和计算机软件,同时为了提高本书作为学科入门教材的易读性,我们在本书正文没有采用详细标引文献的方法,而是将所有参考文献、软件等列在书末作为读者进一步学习阅读与研究的资源。我们虽已尽心尽力,但由于水平所限,错漏之处难免,请大家不吝赐教,共同推动计量语言学在中国的发展。刘海涛2017年5月1日于启真湖畔这几天不断有朋友询问何时何地可以买到《计量语言学导论》。谢谢大家的关注!目前书正在印刷中,小编会在第一时间播报上市信息。可以预先透露一下,书上市后会有赠阅活动哦!所以,赶紧识别下图二维码关注本号吧。往期回顾:JQL主编Köhler教授序《计量语言学导论》全文大神Altmann教授序《计量语言学导论》全文这个星球上的第一本《计量语言学导论》即将上市!
2017年9月10日
其他

JQL主编Köhler教授序《计量语言学导论》全文

昨天本号推送了现代计量语言学奠基人之一、德国波鸿鲁尔大学荣休教授阿尔特曼先生为《计量语言学导论》做的序。阿尔特曼教授在计量语言学领域取得了卓越成就,除了丰硕的研究成果外,最值得称赞的是他培养了一大批学生。这些学生中有很多人如今已经成为计量语言学研究领域的代表人物。其中,就包括下面这位大牛。莱因哈德·科勒(Reinhard
2017年9月9日
其他

大神Altmann教授序《计量语言学导论》全文

昨天本号首秀刷了个屏,主编大人率一众小编在这里向大家表示诚挚的谢意!今天给大家带来的是阿尔特曼教授为《计量语言学导论》做的序。先来认识一下这位大神。加布里埃尔·阿尔特曼(Gabriel
2017年9月8日
其他

这个星球上的第一本《计量语言学导论》即将上市!

语言学是科学吗?语言学有理论吗?科学哲学意义上的语言学理论长什么样儿呢?语言学研究如何走向科学化?全球首部计量语言学导论性著作——《计量语言学导论》即将与大家见面,对以上问题将给出详尽的解答。该书由国际计量语言学学会(International
2017年9月7日